来自腾讯架构师对，Redis的实践及思考

勤奋的码农 · 2019-08-23 23:32:50 · 15648 次点击 · 预计阅读时间 4 分钟 · 大约8小时之前开始浏览

这是一个创建于 2019-08-23 23:32:50 的文章，其中的信息可能已经有所发展或是发生改变。

导语：当面临存储选型时是选择关系型还是非关系型数据库？如果选择了非关系型的redis，redis常用数据类型占用内存大小如何估算的？redis的性能瓶颈又在哪里？

背景

前段时间接手了一个业务，响应时间达到10s左右。阅读源码后发现，每一次请求都是查询多个分表数据（task1,task2….），然后再join其他表(course,teacher..)，时间全部花在了大量磁盘I/O上。脑袋一拍，重构，上redis！

为什么选择redis

拍脑袋做技术方案肯定是不行的，得用数据和逻辑说服别人才可以。

时延

时延=后端发起请求db（用户态拷贝请求到内核态）+ 网络时延 + 数据库寻址和读取

如果想要降低时延，只能减少请求数（合并多个后端请求）和减少数据库寻址和读取得时间。从降低时延的角度，基于单线程和内存的redis，每秒10万次得读写性能肯定远远胜过磁盘读写性能。

数据规模

以redis一组K-V为例（”hello” -> “world”），一个简单的set命令最终会产生4个消耗内存的结构。

来自腾讯架构师对，Redis的实践及思考

关于Redis数据存储的细节，又要涉及到内存分配器（如jemalloc），简单说就是存储170字节，其实内存分配器会分配192字节存储。Java架构圈子

来自腾讯架构师对，Redis的实践及思考

那么总的花费就是

一个dictEntry，24字节，jemalloc会分配32字节的内存块
一个redisObject，16字节，jemalloc会分配16字节的内存块
一个key，5字节，所以SDS(key)需要5+9=14个字节，jemalloc会分配16字节的内存块
一个value，5字节，所以SDS(value)需要5+9=14个字节，jemalloc会分配16字节的内存块

综上，一个dictEntry需要32+16+16+16=80个字节。

上面这个算法只是举个例子，想要更深入计算出redis所有数据结构的内存大小，可以参考这篇文章。

笔者使用的是哈希结构，这个业务需求大概一年的数据量是200MB，从使用redis成本上考虑没有问题。

需求特点

笔者这个需求背景读多写少，冷数据占比比较大，但数据结构又很复杂（涉及多个维度数据总和），因此只要启动定时任务离线增量写入redis，请求到达时直接读取redis中的数据，无疑可以减少响应时间。

来自腾讯架构师对，Redis的实践及思考

[ 最终方案 ]

redis瓶颈和优化

HGETALL

最终存储到redis中的数据结构如下图。

来自腾讯架构师对，Redis的实践及思考

采用同步的方式对三个月（90天）进行HGETALL操作，每一天花费30ms，90次就是2700ms！redis操作读取应该是ns级别的，怎么会这么慢？利用多核cpu计算会不会更快？

来自腾讯架构师对，Redis的实践及思考

常识告诉我，redis指令执行速度 >> 网络通信(内网) > read/write等系统调用。因此这里其实是I/O密集型场景，就算利用多核cpu，也解决不到根本的问题，最终影响redis性能，****其实是网卡收发数据和**用户态内核态数据拷贝******。

pipeline

这个需求qps很小，所以网卡也不是瓶颈了，想要把需求优化到1s以内，减少I/O的次数是关键。换句话说，充分利用带宽，增大系统吞吐量。

于是我把代码改了一版，原来是90次I/O，现在通过redis pipeline操作，一次请求半个月，那么3个月就是6次I/O。很开心，时间一下子少了1000ms。

来自腾讯架构师对，Redis的实践及思考

pipeline携带的命令数

代码写到这里，我不经反问自己，为什么一次pipeline携带15个HGETALL命令，不是30个，不是40个？换句话说，一次pipeline携带多少个HGETALL命令才会发起一次I/O？

我使用是golang的redisgo 的客户端，翻阅源码发现，redisgo执行pipeline逻辑是把命令和参数写到golang原生的bufio中，如果超过bufio默认最大值（4096字节），就发起一次I/O，flush到内核态。

来自腾讯架构师对，Redis的实践及思考

redisgo编码pipeline规则如下图，*表示后面参数加命令的个数，$表示后面的字符长度，一条HGEALL命令实际占45字节。

那其实90天数据，一次I/O就可以搞定了（90 * 45 < 4096字节）!

来自腾讯架构师对，Redis的实践及思考

果然，又快了1000ms，耗费时间达到了1秒以内

来自腾讯架构师对，Redis的实践及思考

对吞吐量和qps的取舍

笔者需求任务算是完成了，可是再进一步思考，redis的pipeline一次性带上多少HGETALL操作的key才是合理的呢？换句话说，服务器吞吐量大了，可能就会导致qps急剧下降（网卡大量收发数据和redis内部协议解析，redis命令排队堆积，从而导致的缓慢），而想要qps高，服务器吞吐量可能就要降下来，无法很好的利用带宽。

对两者之间的取舍，同样是不能拍脑袋决定的，用压测数据说话！

简单写了一个压测程序，通过比较请求量和qps的关系，来看一下吞吐量和qps的变化，从而选择一个适合业务需求的值。

来自腾讯架构师对，Redis的实践及思考

windows上单机版redis结果如下：

来自腾讯架构师对，Redis的实践及思考

扩展（分布式方案下pipeline操作）

需求最终是完成了，可是转念一想，现在都是集群版的redis，pipeline批量请求的key可能分布在不同的机器上，但pipeline请求最终可能只被一台redis server处理，那不就是会读取数据失败吗？于是，笔者查找几个通用的redis 分布式方案，看看他们是如何处理这pipeline问题的。

redis cluster

redis cluster 是官方给出的分布式方案。 Redis Cluster在设计中没有使用一致性哈希，而是使用数据分片（Sharding）引入哈希槽（hash slot）来实现。一个 Redis Cluster包含16384（0~16383）个哈希槽，存储在Redis Cluster中的所有键都会被映射到这些slot中，集群中的每个键都属于这16384个哈希槽中的一个，集群使用公式slot=CRC16 key/16384来计算key属于哪个槽。比如redis cluster有5个节点，每个节点就负责一部分哈希槽，如果参数的多个key在不同的slot，在不同的主机上，那么必然会出错。

因此redis cluster分布式方案是不支持pipeline操作，如果想要做，只有客户端缓存slot和redis节点的关系，在批量请求时，就通过key算出不同的slot以及redis节点，并行的进行pipeline。

github.com/go-redis就是这样做的，有兴趣可以阅读下源码。

来自腾讯架构师对，Redis的实践及思考

codis

市面上还流行着一种在客户端和服务端之间增设代理的方案，比如codis就是这样。对于上层应用来说，连接 Codis-Proxy 和直接连接原生的 Redis-Server 没有的区别，也就是说codis-proxy会帮你做上面并行分槽请求redis server，然后合并结果在一起的操作，对于使用者来说无感知。

总结

在做需求的过程中，发现了很多东西不能拍脑袋决定，而是前期做技术方案的时候，想清楚，调研好，用数据和逻辑去说服自己。

粉丝福利

来自腾讯架构师对，Redis的实践及思考

如果对java微服务、分布式、高并发、高可用、大型互联网架构技术、面试经验交流。
可以加我Java架构圈子: 领取资料，里面每天更新资料，免费领取。

有疑问加站长微信联系（非本文作者）

本文来自：简书

感谢作者：勤奋的码农

查看原文：来自腾讯架构师对，Redis的实践及思考

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

15648 次点击

加入收藏微博

收入我的专栏

上一篇：科学安装 golang package

下一篇：从简历被拒到收割今日头条offer，我花了一年时间

redis

架构师

换句

java

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

来自腾讯架构师对，Redis的实践及思考

背景

为什么选择redis

redis瓶颈和优化

扩展（分布式方案下pipeline操作）

总结

粉丝福利

用户登录

今日阅读排行

一周阅读排行

关注我

背景

为什么选择redis

redis瓶颈和优化

扩展（分布式方案下pipeline操作）

总结

粉丝福利

来自腾讯架构师对，Redis的实践及思考

背景

为什么选择redis

redis瓶颈和优化

扩展 （分布式方案下pipeline操作）

总结

粉丝福利

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

背景

为什么选择redis

redis瓶颈和优化

扩展 （分布式方案下pipeline操作）

总结

粉丝福利

扩展（分布式方案下pipeline操作）

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏

扩展（分布式方案下pipeline操作）