Golang分代GC的策略

Leonard_Wang · 2019-05-01 21:34:41 · 1684 次点击 · 预计阅读时间 5 分钟 · 大约8小时之前开始浏览

这是一个创建于 2019-05-01 21:34:41 的文章，其中的信息可能已经有所发展或是发生改变。

序

上一篇文章中讲解了Go分代GC的实现思路，还有一个问题没有讲解，Go中分代GC（Garbage Collection）的策略，如何穿插使用Minor GC和Major GC ？

为何要穿插使用？

file

图片仅用作说明，有些地方不是很严谨，也与Go的GC方式不完全相同。
因为每轮GC都会有新的存活对象，存活下来的对象即被认为是老年代对象，这些对象在执行Minor GC期间是不会被清扫的，这也就会导致使用的堆内存会越来越大。经过几轮GC之后有些老年代对象可能已经不可达，可以被回收了，这时就要进行Major GC来进行完整的清扫，不论老年代对象和新生代对象，只要不再存活，就会被清扫回收掉，达到释放内存的目的。上一篇文章也有说到，Go将分代GC算法与标记清扫算法相结合，实现了一个不移动的分代GC，究竟是如何结合使用的，就是本篇文章所要讲的。

如何进行穿插使用

下面的代码就是是判断本轮GC执行Minor GC或Major GC判断的函数，当函数返回true时，执行Full GC（Major GC），返回false时，执行Gen GC（Minor GC）。

func isGCCycleFull() bool {
    if !gcGen {
        return true
    }

    if gen.spaceFull || gen.forceFullGC {
        return true
    }

    // If full GC are taking a reasonable amount of time do not
    // bother with a generational GC.
    percentGCTime := int(memstats.gc_cpu_fraction * 100)
    if percentGCTime < gen.highCostThreshold {
        return true
    }

    // The next cycle will be full during warmup.
    // Perhaps this should trigger as long as we are initializing which we can
    // defined as a monotonic increase in heap size.
    if gen.cycleCount < gen.warmupCount {
        // number of warmup GC to do before considering a generational GC.
        return true
    }

    if gen.countBased {
        if gen.cycleCount%gen.cycleModulus == 0 {
            return gen.countBasedGen
        } else {
            return !gen.countBasedGen
        }
    }

    if work.fullRunCount >= work.fullSwitchCount {
        // Do a generational GC at least every switchCount GCs.
        return false
    }

    // Consider heuristics based on previous mark / cons ratios.
    if work.fullMarkConsEWMA*1.1 < work.genMarkConsEWMA {
        // This forces a generational GC as soon as warmup is over since work.genMarkConsEWMA is 0
        return true
    }

    // Do a generational GC in the next cycle.
    return false
}

下面分段解释一些这个函数，深入分析一下Go 的分代GC策略

gcGen是一个const常量，表示是否开启分代GC模式，当未开启时和原生GC无区别，每次都是执行Full GC。

if !gcGen {
    return true
}

spaceFull是标记本轮Gen GC中存活的对象空间与上一次Full GC中释放的空间的一半的大小关系，在一轮Full GC后可能有连续几次的Gen GC ，这里的Full GC是指最近的一次Full GC。当本轮Gen GC中存活的对象空间大于上一次Full GC中释放的空间的一半时，spaceFull就会被置成true；forceFullGC在用户手动调用runtime.GC时会被置成true。

if gen.spaceFull || gen.forceFullGC {
    return true
}

percentGCTime是GC所占CPU时间的百分比，即gctrace中的百分数，下面数据中的6%，highCostThreshold在不开启调试模式，程序正常运行时的初始值为10，不会改变，即GC所占CPU时间的百分比小于10%时都不会进行Gen GC，调试模式中highCostThreshold=1。
gc 24 @1.583s 6%: 0.014+33+0.008 ms clock, 0.11+0/62/54+0.069 ms cpu, 158->158->316 MB, 316 MB goal, 8 P

percentGCTime := int(memstats.gc_cpu_fraction * 100)
if percentGCTime < gen.highCostThreshold {
    return true
}

cycleCount表示应用程序当前共进行了多少轮的GC（包含Full GC和Gen GC），warmupCount目前的初始值为4，不会改变。这条规则表示的意思是，在前4轮GC不要进行Gen GC，因为前几轮对象较少，堆内存也较小，进行Gen GC可能不会有收益，可以理解为在进行初始化为Gen GC做准备。

if gen.cycleCount < gen.warmupCount {
    // number of warmup GC to do before considering a generational GC.
    return true
}

countBase的初始值目前是false，countBasedGen的初值目前是false，cycleModulus的初始值目前为2，不会改变。那么眼尖的人已经看出来了，这个分支没有用啊，countBase一直为false，那么这个分支就永远不会走。这个分支可以理解为用来强制触发Gen GC来进行测试和实验数据获取的。试想一下如果这样设置countBased=true,cycleModulus=2,countBasedGen=false，那么如果可以走到这个分支，Full GC和Gen GC的穿插策略即是，每2轮作为一个循环，奇数轮返回true执行Full GC，偶数轮返回false执行Gen GC。

if gen.countBased {
    if gen.cycleCount%gen.cycleModulus == 0 {
        return gen.countBasedGen
    } else {
        return !gen.countBasedGen
    }
}

一起说下剩下的几条规则。fullRunCount表示自从上一轮Gen GC后执行了多少轮Full GC，同样，在一轮Gen GC后也有可能连续几次的Full GC ；fullSwitchCount是一个在程序中会根据情况进行更新的值，初始值为0，每次更新都会+8。介绍几个概念
EWMA（指数加权移动平均值）：可以简单的认为是平均值，有兴趣的可以自己查下资料深入理解下。
MarkConsEWMA：Mark是指本轮GC中的标记成本（使用的CPU时间），Con是指本轮GC中释放的内存量，MarkConsEWMA是Mark/Con这个值的EWMA，对于Full GC和Gen GC分别维护一个MarkConsEWMA。个人认为可以理解为GC的性价比，标记成本越小越好，释放的内存越多越好，所以MarkConsEWMA这个值越小越好。
如果在Full GC后的第一轮Gen GC中，单轮的MarkCons大于Full GC的MarkConsEWMA，或者Gen GC的总MarkConsEWMA大于Full GC的总MarkConsEWMA，即Gen GC的收益没有Full GC大时，那么fullSwitchCount将会+8，即更倾向于多做Full GC。
另外如果Gen GC的总MarkConsEWMA大于Full GC的总MarkConsEWMA的1.1倍时，也会进行Full GC，如果所有规则都没有匹配，默认进行Gen GC。

if work.fullRunCount >= work.fullSwitchCount {
    // Do a generational GC at least every switchCount GCs.
    return false
}
if work.fullMarkConsEWMA*1.1 < work.genMarkConsEWMA {
    // This forces a generational GC as soon as warmup is over since work.genMarkConsEWMA is 0
    return true
}
return false

isGCCycleFull函数返回值的更新时间点

在GC的标记完成之后，扫描开始之前的这个时间点会确定下一轮GC时Full GC还是Gen GC。

A GC cycle starts after mark is complete and sweeping is about to begin. It is at this point that the decision of whether the upcoming cycle will be generational or a full GC is made.

End

如有错误还请指出，欢迎交流讨论。
转载请注明出处，谢谢。
最后祝大家劳动节快乐。

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：Leonard_Wang

查看原文：Golang分代GC的策略

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

1684 次点击

加入收藏微博

收入我的专栏

上一篇：1-3年的程序员，你跳槽了吗？

下一篇：忠诚与背叛：Emacs 遭遇背刺，你将何去何从？

函数

调试模式

单轮

相结合

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

Golang分代GC的策略

序

为何要穿插使用？

如何进行穿插使用

isGCCycleFull函数返回值的更新时间点

End

用户登录

今日阅读排行

一周阅读排行

关注我

序

为何要穿插使用？

如何进行穿插使用

isGCCycleFull函数返回值的更新时间点

End

Golang分代GC的策略

序

为何要穿插使用？

如何进行穿插使用

isGCCycleFull函数返回值的更新时间点

End

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

序

为何要穿插使用？

如何进行穿插使用

isGCCycleFull函数返回值的更新时间点

End

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏