浅谈JVM调优
促使我写下这篇文章的是软件构造Lab5中中尝试JVM参数调优的时候,程序的效率提高一了倍 ,由此可见参数对于Java程序重要性,下面就简述一下我在Lab5里面调优的过程以及参数的简介。
一.前言
先说明一下,这里的JVM参数,其实就是调整JVM的GC策略以及GC的各个部分大小,下面会给出详细说明。
二.GC策略以及各部分的分布
先讲讲基本的四种算法吧
1.引用计数算法(Reference counting)
这个算法还是比较好理解的,顾名思义,就是有一个为每一个对象储存一个计数器,当每有引用(别名)指向它时,计数器就加一个,当这个引用断开时,计数器就减一,当检测计数器为0的时候就回收这个对象。
优点:简单,计算代价分散,幽灵时间短 缺点:容易漏掉对象(循环的时候),并发难,计数都保存在一个内存池里面,多线程容易出问题,而且还占用额外的内存空间等等问题。
2.标记-清除算法(Mark-Sweep)
这个算法也不难理解,上面那个储存一个对引用的计数器,这里是储存一个状态位来记录这个对象是live还是dead,称此为mark阶段,然后就是对标记了dead的对象进行清理,即sweep阶段。
优点:运行时对开销比较小(不用对每一个引用都记录,一个即可) 缺点:和上面不同,mark和sweep需要程序停下来才能执行,导致额外的幽灵时间大增,会影响程序性能,而且回收的时候是就地回收的,会导致内存碎片化,为后来的要使用内存的对象再利用造成困难。
3.标记-整理算法(Mark-Compact)
这个相比于上面就是多了整理的阶段,在清除完以后,为了避免内存碎片化,将内存中有用的对象重新整理储存。
优点:避免碎片化 缺点:相比于上面增加了整理,耗费的时间肯定比上面多,但是继续运行的时候对内存的继续使用会好很多,算是一种妥协。
4.复制(Fragmentation and Copying)
这个是基于上面那个整理算法的,只不过上面那个是在原本的内存里面整理,而这个是将所有的存活对象复制到另外一个区域,用空间换时间。
优点:相比于上面的时间消耗要短很多。 缺点:相比于上面的耗费了大量的内存空间。
三:JVM内存管理
这里稍微介绍一下JVM里面的内存分布,先上一张图:
不难看出Object出生在Eden(伊甸园)里面,然后经过Young GC后进入S1,S2(From,To)区域,能够在S1和S2里面交换储存,然后将存活时间比较久的放到Old区里面,在Old区快满的时候,将会进行Full GC,这里的Young GC和Full GC使用的是不同的策略,Young GC比较由于频繁且空间比较小,采用的是Copy算法,Full GC空间大,不同的程序的需求不同,这时候就需要在调节JVM的参数,对于不同的程序,young的空间和Old空间的需求也不同,有的程序新生代相当多,就需要调整Eden多区域,有的程序新生代和老一代划分明显,不需要过多判断,就可以将S1和S2区域调节的小一点,减少缓冲时间,直接进入Old区域等等等等。
四:实战调参
上面说了这么多的废话终于进入正题了,到底怎么样去调参呢?可以调节的参数有哪些呢?先上图:
从这个图里面可以很容易与上面的图对应起来,上下写的类似“-XX:NewSize”这样的东西就是参数,可以吧这个东西写到eclipse右键run configure里面的arguments的下面的VM参数里面,idea里面也有相关的设置的工具,这上面的这些东西都是相关于内存空间的,可以根据自己的程序里面的Object的更新速度,以及需要GC的频率,和是否异常,来根据需要大致调节一下,然后可以慢慢值试来达到对于程序能够达到最快的性能的程度。
附录:参数大全
-Xms512m
-Xmx512m
-XX:MetaspaceSize=128m
-XX:MaxMetaspaceSize=128m
-XX:NewSize=128m
-XX:MaxNewSize=128m
-XX:SurvivorRatio=8
-XX:+DisableExplicitGC
-XX:+PrintGCDetails
-XX:+UseConcMarkSweepGC
-XX:ParallelCMSThreads=12
-verbose:gc
-XX:+HeapDumpOnOutOfMemoryError
-XX:+PrintGCTimeStamps
-Xloggc:../../logs/gc-console.log
部分参数介绍:(以下转载自:https://www.cnblogs.com/marcotan/p/4256885.html)
-Xmx3550m:设置JVM最大堆内存为3550M。 -Xms3550m:设置JVM初始堆内存为3550M。此值可以设置与-Xmx相同,以避免每次垃圾回收完成后JVM重新分配内存。 -Xss128k:设置每个线程的栈大小。JDK5.0以后每个线程栈大小为1M,之前每个线程栈大小为256K。应当根据应用的线程所需内存大小进行调整。在相同物理内存下,减小这个值能生成更多的线程。但是操作系统对一个进程内的线程数还是有限制的,不能无限生成,经验值在3000~5000左右。需要注意的是:当这个值被设置的较大(例如>2MB)时将会在很大程度上降低系统的性能。 -Xmn2g:设置年轻代大小为2G。在整个堆内存大小确定的情况下,增大年轻代将会减小年老代,反之亦然。此值关系到JVM垃圾回收,对系统性能影响较大,官方推荐配置为整个堆大小的3/8。 -XX:NewSize=1024m:设置年轻代初始值为1024M。 -XX:MaxNewSize=1024m:设置年轻代最大值为1024M。 -XX:PermSize=256m:设置持久代初始值为256M。 -XX:MaxPermSize=256m:设置持久代最大值为256M。 -XX:NewRatio=4:设置年轻代(包括1个Eden和2个Survivor区)与年老代的比值。表示年轻代比年老代为1:4。 -XX:SurvivorRatio=4:设置年轻代中Eden区与Survivor区的比值。表示2个Survivor区(JVM堆内存年轻代中默认有2个大小相等的Survivor区)与1个Eden区的比值为2:4,即1个Survivor区占整个年轻代大小的1/6。 -XX:MaxTenuringThreshold=7:表示一个对象如果在Survivor区(救助空间)移动了7次还没有被垃圾回收就进入年老代。如果设置为0的话,则年轻代对象不经过Survivor区,直接进入年老代,对于需要大量常驻内存的应用,这样做可以提高效率。如果将此值设置为一个较大值,则年轻代对象会在Survivor区进行多次复制,这样可以增加对象在年轻代存活时间,增加对象在年轻代被垃圾回收的概率,减少Full GC的频率,这样做可以在某种程度上提高服务稳定性。
疑问解答
-Xmn,-XX:NewSize/-XX:MaxNewSize,-XX:NewRatio 3组参数都可以影响年轻代的大小,混合使用的情况下,优先级是什么? 如下: 高优先级:-XX:NewSize/-XX:MaxNewSize 中优先级:-Xmn(默认等效 -Xmn=-XX:NewSize=-XX:MaxNewSize=?) 低优先级:-XX:NewRatio 推荐使用-Xmn参数,原因是这个参数简洁,相当于一次设定 NewSize/MaxNewSIze,而且两者相等,适用于生产环境。-Xmn 配合 -Xms/-Xmx,即可将堆内存布局完成。 -Xmn参数是在JDK 1.4 开始支持。
垃圾回收器选择
JVM给出了3种选择:串行收集器、并行收集器、并发收集器。串行收集器只适用于小数据量的情况,所以生产环境的选择主要是并行收集器和并发收集器。 默认情况下JDK5.0以前都是使用串行收集器,如果想使用其他收集器需要在启动时加入相应参数。JDK5.0以后,JVM会根据当前系统配置进行智能判断。 串行收集器 -XX:+UseSerialGC:设置串行收集器。 并行收集器(吞吐量优先) -XX:+UseParallelGC:设置为并行收集器。此配置仅对年轻代有效。即年轻代使用并行收集,而年老代仍使用串行收集。 -XX:ParallelGCThreads=20:配置并行收集器的线程数,即:同时有多少个线程一起进行垃圾回收。此值建议配置与CPU数目相等。 -XX:+UseParallelOldGC:配置年老代垃圾收集方式为并行收集。JDK6.0开始支持对年老代并行收集。 -XX:MaxGCPauseMillis=100:设置每次年轻代垃圾回收的最长时间(单位毫秒)。如果无法满足此时间,JVM会自动调整年轻代大小,以满足此时间。 -XX:+UseAdaptiveSizePolicy:设置此选项后,并行收集器会自动调整年轻代Eden区大小和Survivor区大小的比例,以达成目标系统规定的最低响应时间或者收集频率等指标。此参数建议在使用并行收集器时,一直打开。 并发收集器(响应时间优先) -XX:+UseConcMarkSweepGC:即CMS收集,设置年老代为并发收集。CMS收集是JDK1.4后期版本开始引入的新GC算法。它的主要适合场景是对响应时间的重要性需求大于对吞吐量的需求,能够承受垃圾回收线程和应用线程共享CPU资源,并且应用中存在比较多的长生命周期对象。CMS收集的目标是尽量减少应用的暂停时间,减少Full GC发生的几率,利用和应用程序线程并发的垃圾回收线程来标记清除年老代内存。 -XX:+UseParNewGC:设置年轻代为并发收集。可与CMS收集同时使用。JDK5.0以上,JVM会根据系统配置自行设置,所以无需再设置此参数。 -XX:CMSFullGCsBeforeCompaction=0:由于并发收集器不对内存空间进行压缩和整理,所以运行一段时间并行收集以后会产生内存碎片,内存使用效率降低。此参数设置运行0次Full GC后对内存空间进行压缩和整理,即每次Full GC后立刻开始压缩和整理内存。 -XX:+UseCMSCompactAtFullCollection:打开内存空间的压缩和整理,在Full GC后执行。可能会影响性能,但可以消除内存碎片。 -XX:+CMSIncrementalMode:设置为增量收集模式。一般适用于单CPU情况。 -XX:CMSInitiatingOccupancyFraction=70:表示年老代内存空间使用到70%时就开始执行CMS收集,以确保年老代有足够的空间接纳来自年轻代的对象,避免Full GC的发生。 其它垃圾回收参数 -XX:+ScavengeBeforeFullGC:年轻代GC优于Full GC执行。 -XX:-DisableExplicitGC:不响应 System.gc() 代码。 -XX:+UseThreadPriorities:启用本地线程优先级API。即使 java.lang.Thread.setPriority() 生效,不启用则无效。 -XX:SoftRefLRUPolicyMSPerMB=0:软引用对象在最后一次被访问后能存活0毫秒(JVM默认为1000毫秒)。 -XX:TargetSurvivorRatio=90:允许90%的Survivor区被占用(JVM默认为50%)。提高对于Survivor区的使用率。 辅助信息参数设置 -XX:-CITime:打印消耗在JIT编译的时间。 -XX:ErrorFile=./hs_err_pid.log:保存错误日志或数据到指定文件中。 -XX:HeapDumpPath=./java_pid.hprof:指定Dump堆内存时的路径。 -XX:-HeapDumpOnOutOfMemoryError:当首次遭遇内存溢出时Dump出此时的堆内存。 -XX:OnError=";":出现致命ERROR后运行自定义命令。 -XX:OnOutOfMemoryError=";":当首次遭遇内存溢出时执行自定义命令。 -XX:-PrintClassHistogram:按下 Ctrl+Break 后打印堆内存中类实例的柱状信息,同JDK的 jmap -histo 命令。 -XX:-PrintConcurrentLocks:按下 Ctrl+Break 后打印线程栈中并发锁的相关信息,同JDK的 jstack -l 命令。 -XX:-PrintCompilation:当一个方法被编译时打印相关信息。 -XX:-PrintGC:每次GC时打印相关信息。 -XX:-PrintGCDetails:每次GC时打印详细信息。 -XX:-PrintGCTimeStamps:打印每次GC的时间戳。 -XX:-TraceClassLoading:跟踪类的加载信息。 -XX:-TraceClassLoadingPreorder:跟踪被引用到的所有类的加载信息。 -XX:-TraceClassResolution:跟踪常量池。 -XX:-TraceClassUnloading:跟踪类的卸载信息。
关于参数名称等
标准参数(-),所有JVM都必须支持这些参数的功能,而且向后兼容;例如: -client——设置JVM使用Client模式,特点是启动速度比较快,但运行时性能和内存管理效率不高,通常用于客户端应用程序或开发调试;在32位环境下直接运行Java程序默认启用该模式。 -server——设置JVM使Server模式,特点是启动速度比较慢,但运行时性能和内存管理效率很高,适用于生产环境。在具有64位能力的JDK环境下默认启用该模式。 非标准参数(-X),默认JVM实现这些参数的功能,但是并不保证所有JVM实现都满足,且不保证向后兼容; 非稳定参数(-XX),此类参数各个JVM实现会有所不同,将来可能会不被支持,需要慎重使用;
###JVM服务参数调优实战
大型网站服务器案例
承受海量访问的动态Web应用 服务器配置:8 CPU, 8G MEM, JDK 1.6.X 参数方案: -server -Xmx3550m -Xms3550m -Xmn1256m -Xss128k -XX:SurvivorRatio=6 -XX:MaxPermSize=256m -XX:ParallelGCThreads=8 -XX:MaxTenuringThreshold=0 -XX:+UseConcMarkSweepGC 调优说明: -Xmx 与 -Xms 相同以避免JVM反复重新申请内存。-Xmx 的大小约等于系统内存大小的一半,即充分利用系统资源,又给予系统安全运行的空间。 -Xmn1256m 设置年轻代大小为1256MB。此值对系统性能影响较大,Sun官方推荐配置年轻代大小为整个堆的3/8。 -Xss128k 设置较小的线程栈以支持创建更多的线程,支持海量访问,并提升系统性能。 -XX:SurvivorRatio=6 设置年轻代中Eden区与Survivor区的比值。系统默认是8,根据经验设置为6,则2个Survivor区与1个Eden区的比值为2:6,一个Survivor区占整个年轻代的1/8。 -XX:ParallelGCThreads=8 配置并行收集器的线程数,即同时8个线程一起进行垃圾回收。此值一般配置为与CPU数目相等。 -XX:MaxTenuringThreshold=0 设置垃圾最大年龄(在年轻代的存活次数)。如果设置为0的话,则年轻代对象不经过Survivor区直接进入年老代。对于年老代比较多的应用,可以提高效率;如果将此值设置为一个较大值,则年轻代对象会在Survivor区进行多次复制,这样可以增加对象再年轻代的存活时间,增加在年轻代即被回收的概率。根据被海量访问的动态Web应用之特点,其内存要么被缓存起来以减少直接访问DB,要么被快速回收以支持高并发海量请求,因此其内存对象在年轻代存活多次意义不大,可以直接进入年老代,根据实际应用效果,在这里设置此值为0。 -XX:+UseConcMarkSweepGC 设置年老代为并发收集。CMS(ConcMarkSweepGC)收集的目标是尽量减少应用的暂停时间,减少Full GC发生的几率,利用和应用程序线程并发的垃圾回收线程来标记清除年老代内存,适用于应用中存在比较多的长生命周期对象的情况。
内部集成构建服务器案例
高性能数据处理的工具应用 服务器配置:1 CPU, 4G MEM, JDK 1.6.X 参数方案: -server -XX:PermSize=196m -XX:MaxPermSize=196m -Xmn320m -Xms768m -Xmx1024m 调优说明: -XX:PermSize=196m -XX:MaxPermSize=196m 根据集成构建的特点,大规模的系统编译可能需要加载大量的Java类到内存中,所以预先分配好大量的持久代内存是高效和必要的。 -Xmn320m 遵循年轻代大小为整个堆的3/8原则。 -Xms768m -Xmx1024m 根据系统大致能够承受的堆内存大小设置即可。
我的Lab5调优实例
一开始觉得是调整大新生代的大小,但是试了一下,好像没有什么作用,后来尝试了多次,发现在快速读取文件并且构建的时候,是不可能不很快就GC的,然后我就接受了这个事实,后来我也不知道该怎么样才算好的调参,然后就针对前面的IO时间进行调整,一点一点试参数,最后尝试最优参数可以让我的I/O时间减少一半!果然是这个参数作用很重要啊!下面是我的参数:
-XX:MetaspaceSize=128m //方法不多,空间小一点
-XX:MaxMetaspaceSize=128m //和上面一样,因为扩张会消耗时间
-XX:SurvivorRatio=32 //让其过渡快一点
-Xms512m
-Xmx512m
-Xmn128m
-verbose:gc //打印gc记录
-XX:+PrintGCDetails //打印细节
-Xloggc:logs/gc.log //将记录储存到**文件夹