垃圾回收算法和垃圾收集器
1.什么是垃圾回收
对于内存当中无用的对象进行回收,如何去判断一个对象是不是无用的对象。
引用计数法:
每个对象中都会存储一个引用计数,每增加一个引用就+1,消失一个引用就-1。当引用计数器为0时就会判断该对象是垃圾,进行回收。
但是这样会有一个弊端。就是当有两个对象互相引用时,那么这两个对象的引用计数器都不为0,那么就不会对其进行回收。
可达性分析:
判断某个对象是否可到达。有两种方式判断是否可到达:
-
直接引用(上帝视角GC Roots):就是虚拟机栈帧中的局部或本地变量表、类加载器、static成员、常量引用、Thread等等中的引用直接到达。
为什么本地或局部变量表里面的变量有它出发就可以用来判断GC Roots的判断标准呢?
因为只用它表示这个栈帧正在被压栈,正在被使用,这个时候再去回收这个对象不是疯了嘛!!!同理static、常量也是一样的道理。
-
间接引用:通过别人的引用来达到。
并发的可达性分析(并发标记、浮动垃圾):https://mp.weixin.qq.com/s/EgVPlOLArsWb86Kujykn3A
2.垃圾回收的策略
垃圾收集算法
-
标记-清除
先标记
后清除
弊端一:会有空间碎片问题,空间不连续;这时如果有大一点的对象进来,发现没有连续的空间内存去进行分配,就会再一次的触发垃圾回收机制。
弊端二:在标记和清除的过程中、会扫描整个堆内存;会比较耗时。
有点:简单、明了、好操作。
-
标记-复制
一开始将这个内存空间一分为二,两边大小相等,一边使用中的,一边是保留区未使用的。划分为这样示例图:
在标记和清除之后,将存活的对象复制到另外一边,在将先前的一边数据全部清除掉。
之后以此反复、两个循环往返。
类似于堆内存中的新生代(Young)区中的Survivor区中的S0、S1,所以堆内存中的新生代(Young)区一定用的就是复制算法。
-
标记-整理
先标记
后整理。
整理移动之后会得到一片连续的可分配内存空间。解决了空间碎片的问题,但是这种方式在标记和整理移动的过程中也是耗时的。
垃圾收集器:评判一个垃圾收集好坏和调优关注的是【高吞吐量、少停顿时间、少垃圾回收次数】
串行:Serial系列;
并行【吞吐量优先】:Paraller系列;
吞吐量:用户代码执行的时间 / (用户代码执行的时间+垃圾收集时间)99/(99+1)=99%。
适用于后台运算,不需要太多的交互场景。
并发【停顿时间优先】:CMS、G1;
适用于用户交互较多的场景,给用户更好的体验感;如Web应用。
JVM垃圾收集器调优的原则:尽可能在停顿时间较低的情况下,追求高的吞吐量和少的垃圾回收次数。
官方JVM垃圾收集器建议:
- 使用默认垃圾收集器
- 调整JVM堆的大小
-
- 如果应用程序内存空间比较小(比如100MB),直接选择SerialGC串行收集器。-XX:+UseSerialGC
- 如果应用程序运行在一个单核的CPU,和没有停顿时间要求的情况下;可以让JVM自己去选择或者选择SerialGC串行收集器。-XX:+UseSerialGC
- 如果应用程序更加关注的吞吐量也没有停顿时间要求的情况下,可以让JVM自己去选择或者选择并行的ParallelGC。-XX+UseParallelGC
- 如果应用程序对停顿时间要求比较高(比如小于1秒钟的时间),那么就选择CMS或者G1的收集器。-XX:+UseConcMarkSweepGC 或 -XX:+UseG1GC
G1(Garbage-First):JDK7出现,JDK8推荐使用,JDK9默认垃圾收集器。
G1的整个垃圾收集并清理的过程阶段大体上和CMS收集器是不变的。在最后一个阶段进行删选回收(选择性的回收,进行优先级的回收:优先回收区域(Region)内存活对象较少的)。
重新设计内存空间如图所示:
整个内存划分为一个个大小相等的区域(Region)。逻辑上对这些区域(Region)进行标记,这些标记有Eden区,Survivor区和Old区。这时的物理空间上就不在是连续空间了;之前的空间划分都是连续的空间。假如回收掉某个Old区的数据,这时这个区域也可能会标位Survivor区或者Eden区。
区域(Region)内还有一个记录rememberd Set。以前会全盘扫描堆内存,是比较耗时的。这时会记录一个对象存活的地方,对象的引用指向;这样就不用在全盘扫描了耗时比较低。
官方文档(G1垃圾收集器的前世今生):https://www.oracle.com/technetwork/tutorials/tutorials-1876574.html
Young Generation(新生代)- 垃圾收集算法一定是标记-复制算法的实现
Serial:JDK1.3出现的,单线程收集,STW。那时候的CPU还是单核CPU。单线程处理效率比较高,在进行垃圾回收的时候,会暂停业务线程,等待垃圾回收完成之后,在让业务线程再继续执行。会搭配老年代的SerialOld配合使用。
这时会出现Stop The World(STW)
ParNew:并行垃圾收集器多个垃圾线程一起跑,STW ,停顿时间较多,更加关注吞吐量
复制算法、并行多线程垃圾收集器,解决了单线程的局限性,但是还是Stop The World(STW)。
ParallelScavenge
同上
Tenured Generation(老年代)- 这里是标记-清除、或标记-整理的算法实现
CMS:JDK5出现的,并发收集,两个阶段会STW(初始标记、重新标记),更加关注停顿时间。在JDK8中已经不推荐使用,JDK8推荐使用G1收集器。
并发:垃圾收集线程和业务代码线程一起跑。但是并不能做到全程一起执行。
因为垃圾收集线程在执行的时候对垃圾进行标记,这时业务代码线程也在执行,也会产生新的垃圾。至少在垃圾收集线程在进行标记的阶段,业务代码暂定的是不执行的。
划分为四个阶段:初始标记、并发标记、重新标记、并发清理。
初始标记:第一阶段会Stop The World(STW)。这个阶段执行的时间是非常快的,如果开启多个线程,会消耗线程之前的切换反而会增加时间成本。
并发标记:第二阶段就是可达性分析,对第一阶段的垃圾进行跟踪。在这个阶段垃圾线程和业务线程是一起执行的;为啥可以一起执行呢?因为在第一阶段初始标记完成后大局已定,第二阶段的并发标记只是做增量的更新。如果此时又产生了垃圾那么就是浮动垃圾(把原本消亡的对象错误的标记为存活状态),只能等待下次清理。
重新标记:第三阶段这时会停止业务代码的线程Stop The World(STW),会多线程垃圾收集器并行一起跑,一起执行。
并发清理:第四阶段垃圾收集线程和业务代码线程再次一起执行,一起跑。
特点:并发收集,停顿时间较少。
缺点:会产生浮动垃圾。其次由于采用的是标记-清除这样的算法会产生大量的空间碎片。
Serial Old:串行的
Paraller Old:并行的
如何查看当前JAVA程序应用使用的是什么垃圾收集器:
# 查看进程ID
jps -l
8720 org.jetbrains.jps.cmdline.Launcher
10212 org.jetbrains.idea.maven.server.RemoteMavenServer36
3764
15480 sun.tools.jps.Jps
4216 com.hopefun.scm.WebApplication
# 查看当前进程下是否使用UseParallelGC
jinfo -flag UseParallelGC 4216
-XX:+UseParallelGC
赵小胖个人博客