|
|
|
| JDK5.0垃圾收集优化之--Don't Pause |
编辑:rocks 审核:rocks 文章来源:CSDN博客
关键词:无 发表日期:2007-05-18 20:04:33 浏览次数:3599次 |
|
|
|
|
本文版权归原作者,中国JAVA手机网收录本文的目的是让更多人阅读到此文章。转载请注明出处为中国JAVA手机网<www.cnjm.net>
来自:http://www.cnjm.net/tech/article4075.html [转载于CSDN博客] 作者:江南白衣 原文链接:http://blog.csdn.net/calvinxiu/archive/2007/05/18/1614473.aspx
原本想把题目更简单的定为--《不要停》的,但还是自己YY一下就算了。 Java开发Server最大的障碍,就是JDK1.4版之前的的串行垃圾收集机制会引起长时间的服务暂停,明白原理后,想想那些用JDK1.3写Server的先辈,不得不后怕。 好在JDK1.4已开始支持多线程并行的后台垃圾收集算法,JDK5.0则优化了默认值的设置。
一、参考资料:
Tuning Garbage Collection with the 5.0 Java Virtual Machine 官方文档。 FAQ about Garbage Collection in the Hotspot JVM 1.4.2 Java HotSpot 虚拟机中的垃圾收集 JavaOne2004上的中文ppt。 JVM 1.4.1 中的垃圾收集、垃圾收集简史 IBM DW中文的文档。 《Garbage Collection : Algorithms for Automatic Dynamic Memory Management》 我没看,谁闷得慌可以emule来看看,书店有中文版。 二、基本概念
1、堆(Heap)
JVM管理的内存叫堆。在32Bit机器上有2G的限制,而64Bit的没有。
JVM初始分配的内存由-Xms指定,默认是物理内存的1/64但小于1G。
JVM最大分配的内存由-Xmx指定,默认是物理内存的1/4但小于1G。
默认空余内存小于到40%时,JVM就会增大内存直到-Xmx的最大限制,可以由-XX:MinHeapFreeRatio=指定。
JAVA手机网[www.cnjm.net] 默认空余内存大于70%时,JVM会减少内存直到-Xms的最小限制,可以由-XX:MaxHeapFreeRatio=指定。
服务器一般设置-Xms、-Xmx相等,避免在每次GC 后调整堆内存的大小,所以上面的两个参数没啥用。
2.基本收集算法
复制:将堆内分成两个相同空间,从根(ThreadLocal的对象,静态对象)开始访问每一个关联的活跃对象,将空间A的活跃对象全部复制到空间B,然后一次性回收整个空间A。该算法因为只访问活跃对象,遍历空间的成本较小,但需要巨大的复制成本和较多的内存。 标记清除(mark-sweep):收集器先从根开始访问所有活跃对象,标记为活跃对象。然后再遍历一次整个内存区域,把所有没有标记活跃的对象进行回收处理。该算法需要遍历整个区域的对象,可能会引起较长的暂停(随空间大小线性增大),而且整理后堆里的碎片很多。 标记整理(mark-compact):综合了上述两者的做法和优点,先标记活跃对象,然后将其合并成较大的内存块。 可见,没有免费的午餐,无论采用复制还是标记清除,这种自动的东西,都要付出很大的性能代价。
3.分代
JAVA手机网[www.cnjm.net] 分代是Java垃圾收集的一大亮点,根据对象的生命周期长短,把堆分为3个区:Young,Tenured 和Permanent,根据不同代的特点采用不同的收集算法,减低垃圾收集恐怖的性能消耗。
Young,年轻代。研究表明大部分对象都是朝生暮死,随生随灭的。因此所有收集器都选择了复制算法。 复制算法优点是只访问活跃对象,缺点是复制成本高。因为年轻代只有少量的对象能熬到垃圾收集,因此只需少量的复制成本。而且复制收集器只访问活跃对象,对那些占了最大比率的死对象视而不见,充分发挥了它的优点。
Young的默认值随总内存由8M到64M不等,由JVM动态管理其大小。 -XX:NewRatio= 参数可以约略的设置Young与Tenured大小的比例,-server时默认为1:2,也可以用-XX:NewSize 和-XX:NewMaxNewSize 硬性规定其大小。
合理平衡Young和Tenured的大小非常非常重要,见后面暂停时间优先收集器的论述。
JAVA手机网[www.cnjm.net] Young里面又分为3个区域,一个Eden,所有新建对象都会存在于该区,两个Survivor区,用来实施复制算法。每次复制就是将Eden和第一块Survior的活对象复制到第2块,然后清空Eden与第一块Survior。Eden与Survivor的比例由-XX:SurvivorRatio=设置,默认为32。Survivio大了会浪费,小了的话,会使一些年轻对象潜逃到老人区,引起老人区的不安,但这个参数对性能并不重要。
Tenured,年老代。年轻代的对象如果能够挺过数次收集,就会进入老人区,使用标记整理算法进行清除了。因为老人区的对象都没那么容易死的,采用复制算法就要反复的复制对象,很不合算,所以采用标记清理算法,但标记清理算法其实也不轻松,每次都要遍历区域内所有对象,所以还是没有免费的午餐啊。
JAVA手机网[www.cnjm.net] XX:MaxTenuringThreshold=设置熬过年轻代多少次收集后移入老人区,为0时,熬过第一次GC就转入。
Permanent,持久代。装载Class信息等基础数据,如果是类很多很多的服务程序,需要加大其设置-XX:MaxPermSize=,否则它满了之后会引起fullgc()。
4.minor/major collection
每个代满了之后都会促发collection,(另外Concurrent Low Pause Collector默认在老人区68%的时候促发)。GC用较高的频率对young进行扫描和回收,这种叫做minor collection。 而对Tenured的检查回收频率要低很多(因为遍历一次好漫长啊),同时对Young和Tenured的收集称为major collection。 System.gc()会引发major collection,使用-XX:+DisableExplicitGC禁止它。
5.小结
Young -- minor collection -- 复制算法
Tenured -- major colletion -- 标记整理算法
JAVA手机网[www.cnjm.net] 三、收集器
JAVA手机网[www.cnjm.net]
JAVA手机网[www.cnjm.net] 1.古老的串行收集器(Serial Collector)
JAVA手机网[www.cnjm.net] 使用 -XX:+UseSerialGC,策略为年轻代串行复制,年老代串行合并整理。
2.吞吐量优先的并行收集器(Throughput Collector)
使用 -XX:+UseParallelGC ,也是JDK5 -server的默认值。策略为: 1.年轻代暂停应用程序,多垃圾收集线程并行的复制收集。 2.年老代暂停应用程序,单垃圾收集线程的合并整理收集。
需要2+的CPU时才会优于串行收集器,适用于后台处理,科学计算。
JAVA手机网[www.cnjm.net] 使用-XX:MaxGCPauseMillis= 和 -XX:GCTimeRatio 来调整GC的时间。
JAVA手机网[www.cnjm.net] 3.暂停时间优先的并发收集器(Concurrent Low Pause Collector-CMS)
JAVA手机网[www.cnjm.net]
JAVA手机网[www.cnjm.net] 前面说了这么多,都是为了这节做铺垫......
JAVA手机网[www.cnjm.net] 使用-XX:+UseConcMarkSweepGC,策略为 1.年轻代同样是暂停暂停应用程序,多垃圾收集线程并行的复制收集 2.年老代则只有两次短暂停,其他时间应用程序与收集线程并发的合并整理。
3.1 年老代详述
并行(Parallel)与并发(Concurrent)仅一字之差,并行指多条垃圾收集线程并行,并发指用户线程与垃圾收集线程并发,程序在继续运行,而垃圾收集程序运行于另一个个CPU上。
并发收集一开始会很短暂的停止一次所有线程来开始初始标记根对象,然后标记线程与应用线程一起并发运行,最后又很短的暂停一次,多线程并行的重新标记之前可能因为并发而漏掉的对象,然后就开始与应用程序并发的垃圾收集。可见,最长的两个遍历过程都是与应用程序并发执行的,比以前的串行算法改进太多太多了!!!
串行标记清除是等年老代满了再开始收集的,因为并发收集要与应用程序一起运行,如果满了才收集,并发的应用程序就无内存可用,所以系统默认68%满的时候就开始收集,可以用-XX:CMSInitiatingOccupancyFraction=设置。
3.2 年轻代详述
可惜对年轻代的复制收集,依然必须停止所有应用程序线程,原理如此,只能靠多CPU,多收集线程并发来提高收集速度,但除非你的Server独占整台服务器,否则如果服务器上本身还有很多其他线程时,切换起来速度就.....
因此Young的大小设置挺重要的,大了不用频繁GC,而且可以增大GC的间隔,让多点对象自己死掉而不用复制了。但Young增大时,GC造成的停顿时间攀升得非常恐怖,谁叫复制算法,要等Young满了才开始收集,开始收集就要停止所有线程呢。
JAVA手机网[www.cnjm.net] 4.增量(train算法)收集器(Incremental Collector)
已停止维护,–Xincgc选项默认转为并发收集器。
四、暂停时间测试
JAVA手机网[www.cnjm.net] 加入下列参数 (请将PrintGC和Details中间的空格去掉,CSDN很怪的认为是禁止字句)
-verbose:gc -XX:+PrintGC Details -XX:+PrintGCTimeStamps
会程序运行过程中将显示如下输出
JAVA手机网[www.cnjm.net] 9.211: [GC 9.211: [ParNew: 7994K->0K(8128K), 0.0123935 secs] 427172K->419977K(524224K), 0.0125728 secs]
显示在程序运行的9.211秒发生了Minor的垃圾收集,前一段数据针对新生区,从7994k整理为0k,新生区总大小为8128k,程序暂停了12ms,而后一段数据针对整个堆。
JAVA手机网[www.cnjm.net] 对于年老代的收集,暂停发生在下面两个阶段,CMS-remark的中断是17毫秒:
[GC [1 CMS-initial-mark: 80168K(196608K)] 81144K(261184K), 0.0059036 secs]
[1 CMS-remark: 80168K(196608K)] 82493K(261184K),0.0168943 secs]
再加两个参数 -XX:+PrintGCApplicationConcurrentTime -XX:+PrintGCApplicationStoppedTime对暂停时间看得更清晰。
五、总结
JAVA手机网[www.cnjm.net] 对于服务器应用,我们使用JDK5的Concurrent Low Pause Collector,对年轻代,暂停时多线程并行复制收集;对年老代,收集器与应用程序并行标记--整理收集,以达到尽量短的垃圾收集时间。
本着没有深刻测试前不要胡乱优化的宗旨,命令行属性只需简单写为:
-server -Xms1024M -Xmx1024M -XX:+UseConcMarkSweepGC
然后要根据应用的情况,在测试软件辅助下对Young等大小精心调配,全部的功力所在。
六、真正不停的JRockit
Bea的JRockit 5.0 R27 有Deterministic GC的选项-Xgcprio: deterministic,通过动态的垃圾收集机制而不是等代满了才收集,号称可以把暂停可以控制在10-30毫秒,非常的牛,一句Deterministic道尽了RealTime的真谛。而JDK6如果上到2G Heap、64MYoung、4CPU、8G内存,就铁定是几百ms上上下下。
细看一下文档,30ms的测试环境是1 GB heap 和 平均 30% 的活跃对象(也就是300M)活动对象,2 个 Xeon 3.6 GHz 4G内存 ,或者是4 个Xeon 2.0 GHz,8G内存。
JAVA手机网[www.cnjm.net] 可惜JRockt的license很奇怪,虽然平时使用免费,但这个30ms选项就需要购买整个Weblogic Real Time Server的license。 其他免费选项,最低只能设置的200ms pause target。
来自:http://www.cnjm.net/tech/article4075.html
|
|
|
相关文章
暂无相关文章
|
|
| 最新评论
|
|
|
|