场景:最近项目准备升级,其中一个步骤就是需要删除一些不再维护的gem,这样就会涉及大量代码的修改,除了增加测试覆盖率以外,最好能使用线上真实的流量来访问测试环境,然后通过newrelic更加详尽的捕捉潜在的错误。
那这里就涉及到流量分流或者流量复制的问题,而goreplay便是解决该问题的一个优秀的工具。
顾名思义,goreplay是基于go语言实现的,要在生产服务器上安装go环境。安装参考:https://golang.org/doc/install,
准备好go语言环境后,goreplay直接提供了编译好的版本,十分方便,直接解压即可,可参考以下步骤:
wget https://github.com/buger/goreplay/releases/download/v0.16.1/gor_0.16.1_x64.tar.gz
tar xvf gor_0.16.1_x64.tar.gz
下面是goreplay官方的图例,简单来讲就是goreplay捕捉线上流量,并将捕捉到的释放到测试服务器上。
下面总结一些goreplay的常用命令:
注:本文中使用sudo权限执行,如需要权限配置,参考:
https://github.com/buger/goreplay/wiki/Running-as-non-root-user
- 捕捉流量并通过终端输出
sudo ./goreplay --input-raw :8000 --output-stdout
上述命令将监控8000端口上所有的流量,并通过终端stdout输出。你可以通过浏览器或者curl访问8000端口,然后在终端查看gor输出所有的http请求。
2.捕捉流量并实时同步到另一台机器
sudo ./goreplay --input-raw :8000 --output-http="http://example:8001"
上述命令将8000端口的流量实时同步访问http://example:8001服务器,你在访问第一台服务器时,将看到流量以相同的顺序请求到第二台.
3.将捕捉流量保存到文件中,然后释放到其它机器
有时候实时同步流量是很难做到的, 所以Goreplay提供了这种先保存后释放的模式:
第一步, 通过--output-file保存流量:
sudo ./goreplay --input-raw :8000 --output-file=requests.gor
上述命令将8000端口的流量,保存到requests.gor文件中(必须是.gor后缀,其它后缀经测释放时有问题)。
第二步,释放保存的流量:
sudo ./goreplay --input-file requests.gor --output-http="http://localhost:8001"
上述命令将释放所有保存在requests.gor中的请求通过相同的时间顺序释放到服务器http://localhost:8001。
参数解释:
--input-raw #用来捕捉http流量,需要指定ip地址和端口
--input-file #接收通过--output-file保存流量的文件
--input-tcp #将多个 Goreplay 实例获取的流量聚集到一个 Goreplay 实例
--output-stdout #终端输出
--output-tcp #将获取的流量转移至另外的 Goreplay 实例
--output-http #流量释放的对象server,需要指定ip地址和端口
--output-file #录制流量时指定的存储文件
Goreplay的限速机制和请求过滤
- 限速机制:
由于生产服务器配置一般远高于测试服务器配置,所以直接将生产服务器全部流量同步到测试服务器是不可行的,goreplay提供了两种策略:
a. 限制每秒的请求数
sudo ./goreplay --input-tcp :28020 --output-http "http://staging.com|10"# (每秒请求数限制10个以内)
sudo ./goreplay --input-raw :80 --output-tcp "replay.local:28020|10%" # (每秒请求数限制10%以内)
b. 基于Header或Url的参数限制一些请求,为指定的header或者url的请求设定限制的百分比。
sudo ./goreplay --input-raw :80 --output-tcp "replay.local:28020|10%" --http-header-limiter "X-API-KEY: 10%"
sudo ./goreplay --input-raw :80 --output-tcp "replay.local:28020|10%" --http-param-limiter "api_key: 10%"
- 请求过滤:
当你需要捕捉指定路径的请求流量时,可以使用该机制, 如只同步/api路径下的请求
sudo ./goreplay --input-raw :8080 --output-http staging.com --http-allow-url /api
该例子值。
另外还有其它一些参数用法:
--http-disallow-url #不允许正则匹配的Url
--http-allow-header #允许的 Header 头
--http-disallow-header #不允许的 Header 头
--http-allow-method #允许的请求方法,传入值为GET, POST, OPTIONS等
更多参考官方文档:https://github.com/buger/goreplay/wiki/Getting-Started
有疑问加站长微信联系(非本文作者)