基于亿条数据的内存，redis两种聚合GO计算的实战思考

hugoren · · 1248 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

总结:

(1) go 的 map读，写是线程不安全的
(2) sync.map 用空间换时间的思想，适合读多写少的场景，读，写是线程安全，但遍历是线程不安全的，运行几个小时以后，出现性能巨降的情况。刚开始18w条/分，后来1w条/分;
(3) orcaman/concurrent-map的思路是把大内存的map划分为若干小内存map
(4)后面redis替换内存后，13w条/分，开了四个goroutine

image.png

每天亿条的数据量

image.png

背景

数据经过filebeat ---->logstash--->kafka--->按一定维度聚合计算------>写入mysql---->grafana展示

聚合计算的数据结构

k, v的map内存存储
计算的数据：
最小，最大，平均，总数，成功，失败，耗时........

内存版本

go 的 map 不加锁

type dataStruct struct {
    cost int64
}

var mapData = make(map[string]dataStruct)

func write(){
    fmt.Println("write")
    //if mapData["cost"].cost != 0 {
    //  fmt.Println("exit")
    //}
    mapData["cost"]=dataStruct{10}
}
func read(){
    fmt.Println("read")
    v := mapData["cost"]
    fmt.Println(v)
}

运行结果：死锁，说明map读，写线程是不安全的

image.png

go map 加锁

type simpleLock struct {
    mu sync.Mutex
    mapData map[string]string

}

var l simpleLock

func write(){
    fmt.Println("write")
    l.mapData = make(map[string]string)
    l.mu.Lock()
    l.mapData["cat"] = "hobb"
    l.mu.Unlock()
}
func read(){
    l.mapData = make(map[string]string)
    fmt.Println("read")
    l.mu.Lock()
    v := l.mapData["cost"]
    l.mu.Unlock()
    fmt.Println(v)

或者这样的写法

var counter = struct{
    sync.RWMutex
    m map[string]int
}{m: make(map[string]int)}

counter.RLock()
n := counter.m["some_key"]
counter.RUnlock()
fmt.Println("some_key:", n)

counter.Lock()
counter.m["some_key"]++
counter.Unlock()

运行的结果

image.png

sync.map

ar syncMap sync.Map

func write(){
    fmt.Println("write")
    syncMap.Store("hugo", "boss")
}
func read(){
    v, _ := syncMap.Load("hugo")
    fmt.Println(v)
}

运行结果

image.png

以上总结

上面的写法，适合，量少，读多写少的场景

大量的读写，还得看redis, mq

通过实践，用redis替代内存后，每分钟的数据由原来的2w条/分达到了 12w条/s。
这性能还可以再优化，通过跟踪，时间有三分之二耗在了消费kafka数据，1条/3ms

image.png

实践的结果

积压的3亿条数据经过一天的消费，只剩下条4000w数据

image.png

参考

深度解密 Go 语言之 sync.map

Golang：一文解决Map并发问题
https://cloud.tencent.com/developer/article/1539049
go 分段锁ConcurrentMap，map+读写锁，sync.map的效率测试
https://blog.csdn.net/yzf279533105/article/details/98636679

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：hugoren

查看原文：基于亿条数据的内存，redis两种聚合GO计算的实战思考

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

1248 次点击

加入收藏微博

收入我的专栏

上一篇：2020-11-13：手写代码：局部最小值问题。数组无序，相邻元素不等。如何求极小值？

下一篇：你以为只是简单的排序？（一）

redis

锁

线程

加锁

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

基于亿条数据的内存，redis两种聚合GO计算的实战思考

背景

聚合计算的数据结构

内存版本

go 的 map 不加锁

go map 加锁

sync.map

以上总结

大量的读写，还得看redis, mq

实践的结果

参考

深度解密 Go 语言之 sync.map

用户登录

今日阅读排行

一周阅读排行

关注我

背景

聚合计算的数据结构

内存版本

go 的 map 不加锁

go map 加锁

sync.map

以上总结

大量的读写，还得看redis, mq

实践的结果

参考

深度解密 Go 语言之 sync.map

基于亿条数据的内存，redis两种聚合GO计算的实战思考

背景

聚合计算的数据结构

内存版本

go 的 map 不加锁

go map 加锁

sync.map

以上总结

大量的读写，还得看redis, mq

实践的结果

参考

深度解密 Go 语言之 sync.map

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

背景

聚合计算的数据结构

内存版本

go 的 map 不加锁

go map 加锁

sync.map

以上总结

大量的读写，还得看redis, mq

实践的结果

参考

深度解密 Go 语言之 sync.map

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏