m3db-node oom追踪和内存分配器代码查看

ning1875 · 2020-08-13 19:32:40 · 659 次点击 · 预计阅读时间 2 分钟 · 大约8小时之前开始浏览

这是一个创建于 2020-08-13 19:32:40 的文章，其中的信息可能已经有所发展或是发生改变。

第一次，站长亲自招 Gopher 了>>>

m3dbnode oom

oom时排查

内存火焰图: 80G内存
bytes_pool_get_on_empty qps 很高
db read qps增长 80%
node cpu kernel 暴涨

看图结论

m3dbnode 内存oom过程很短，很剧烈：总时间不超过7分钟
内存从27G增长到250G
节点sys态cpu暴涨：因为大量的mem_alloca sys_call
内存增长曲线和db_read_qps曲线和bytes_pool_get_on_empty曲线高度吻合
内存火焰图： 27G的rpc 40G的pool.(*objectPool).tryFill

查看代码，追踪火焰图中这个tryFill

内存分配器

目的很简单:自己管理内存，避免频繁的mem_allocate sys_call 提升速度，空间换时间

核心结构

初始化时调用init 向池中注入

type objectPool struct {
    opts                ObjectPoolOptions
    values              chan interface{}
    alloc               Allocator
    size                int
    refillLowWatermark  int
    refillHighWatermark int
    filling             int32
    initialized         int32
    dice                int32
    metrics             objectPoolMetrics
}

    for i := 0; i < cap(p.values); i++ {
        p.values <- p.alloc()
    }

从池中获取对象时

池中还有剩余则直接获取否则走各自的alloc分配
同时设置bytes_pool_get_on_empty

func (p *objectPool) Get() interface{} {
    if atomic.LoadInt32(&p.initialized) != 1 {
        fn := p.opts.OnPoolAccessErrorFn()
        fn(errPoolGetBeforeInitialized)
        return p.alloc()
    }

    var v interface{}
    select {
    case v = <-p.values:
    default:
        v = p.alloc()
        p.metrics.getOnEmpty.Inc(1)
    }

    p.trySetGauges()



    return v
}

同时判断池水位，是否加油

    if p.refillLowWatermark > 0 && len(p.values) <= p.refillLowWatermark {
        p.tryFill()
    }

加油过程

用CompareAndSwapInt32做并发控制标志位
加油加到refillHighWatermark

func (p *objectPool) tryFill() {
    if !atomic.CompareAndSwapInt32(&p.filling, 0, 1) {
        return
    }

    go func() {
        defer atomic.StoreInt32(&p.filling, 0)

        for len(p.values) < p.refillHighWatermark {
            select {
            case p.values <- p.alloc():
            default:
                return
            }
        }
    }()
}

默认池参数

    defaultRefillLowWaterMark  = 0.3
    defaultRefillHighWaterMark = 0.6

总结思考

默认池低水位为什么不是0:因为从水位判断到tryFill中间的并发请求使得最后tryFill开始时低水位可能低于0.3
火焰图中的tryFill消耗了40G内存不是一次性的，类比右侧thriftrpc27，属于累加内存消耗值
一次性的内存消耗肯定没有这么多：每次加油时内存消耗低于初始化
所以可以得到结论，oom是因为在当时byte_pool频繁的get消耗，然后tryFill频繁的加油导致内存分配
所以根本原因还是查询导致的

解决办法:限制query资源消耗保护db

修改m3coordinator参数

有疑问加站长微信联系（非本文作者）

本文来自：Segmentfault

感谢作者：ning1875

查看原文：m3db-node oom追踪和内存分配器代码查看

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

659 次点击

加入收藏微博

收入我的专栏

上一篇：go标准库实现---ASCII 字符包含判断

下一篇：TarsGo 服务获取自定义模版（配置）值

代码

分配器

根本原因

rpc

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

m3db-node oom追踪和内存分配器代码查看

m3dbnode oom

oom时排查

查看代码，追踪火焰图中这个tryFill

内存分配器

核心结构

从池中获取对象时

同时判断池水位，是否加油

加油过程

默认池参数

总结思考

解决办法:限制query资源消耗保护db

用户登录

今日阅读排行

一周阅读排行

关注我

m3dbnode oom

oom时排查

查看代码，追踪火焰图中这个tryFill

内存分配器

核心结构

从池中获取对象时

同时判断池水位，是否加油

加油过程

默认池参数

总结思考

解决办法:限制query资源消耗保护db

m3db-node oom追踪和内存分配器代码查看

m3dbnode oom

oom时排查

查看代码，追踪火焰图中这个tryFill

内存分配器

核心结构

从池中获取对象时

同时判断池水位，是否加油

加油过程

默认池参数

总结思考

解决办法:限制query资源消耗保护db

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

m3dbnode oom

oom时排查

查看代码，追踪火焰图中这个tryFill

内存分配器

核心结构

从池中获取对象时

同时判断池水位，是否加油

加油过程

默认池参数

总结思考

解决办法:限制query资源消耗保护db

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏