Goroutine 泄露

ictar · 2018-03-05 09:01:32 · 6207 次点击 · 预计阅读时间 5 分钟 · 大约8小时之前开始浏览

这是一个创建于 2018-03-05 09:01:32 的文章，其中的信息可能已经有所发展或是发生改变。

Go 中的并发性是以 goroutine（独立活动）和 channel（用于通信）的形式实现的。处理 goroutine 时，程序员需要小心翼翼地避免泄露。如果最终永远堵塞在 I/O 上（例如 channel 通信），或者陷入死循环，那么 goroutine 会发生泄露。即使是阻塞的 goroutine，也会消耗资源，因此，程序可能会使用比实际需要更多的内存，或者最终耗尽内存，从而导致崩溃。让我们来看看几个可能会发生泄露的例子。然后，我们将重点关注如何检测程序是否受到这种问题的影响。

发送到一个没有接收者的 channel

假设出于冗余的目的，程序发送请求到许多后端。使用首先收到的响应，丢弃后面的响应。下面的代码将会通过等待随机数毫秒，来模拟向下游服务器发送请求：

package main

import (  
    "fmt"  
    "math/rand"  
    "runtime"  
    "time"  
)

func query() int {  
    n := rand.Intn(100)  
    time.Sleep(time.Duration(n) * time.Millisecond)  
    return n  
}

func queryAll() int {  
    ch := make(chan int)  
    go func() { ch <- query() }()  
    go func() { ch <- query() }()  
    go func() { ch <- query() }()  
    return <-ch  
}

func main() {  
    for i := 0; i < 4; i++ {  
        queryAll()  
        fmt.Printf("#goroutines: %d", runtime.NumGoroutine())  
    }  
}

输出：

#goroutines: 3  
#goroutines: 5  
#goroutines: 7  
#goroutines: 9

每次调用 queryAll 后，goroutine 的数目会发生增长。问题在于，在接收到第一个响应后，“较慢的” goroutine 将会发送到另一端没有接收者的 channel 中。

可能的解决方法是，如果提前知道后端服务器的数量，那么使用缓存 channel。否则，只要至少有一个 goroutine 仍在工作，我们就可以使用另一个 goroutine 来接收来自这个 channel 的数据。其他的解决方案可能是使用 context（example），利用某些机制来取消其他请求。

从没有发送者的 channel 中接收数据

这种场景类似于发送到一个没有接收者的 channel。泄露 goroutine 这篇文章中包含了一个示例。

nil channel

写入到 nil channel 会永远阻塞：

package main

func main() {  
    var ch chan struct{}  
    ch <- struct{}{}  
}

所以它导致死锁：

fatal error: all goroutines are asleep - deadlock!

goroutine 1 [chan send (nil chan)]:  
main.main()  
...

当从 nil channel 读取数据时，同样的事情发生了：

var ch chan struct{}  
<-ch

当传递尚未初始化的 channel 时，也可能会发生：

package main

import (  
    "fmt"  
    "runtime"  
    "time"  
)

func main() {  
    var ch chan int  
    if false {  
        ch = make(chan int, 1)  
        ch <- 1  
    }  
    go func(ch chan int) {  
        <-ch  
    }(ch)

    c := time.Tick(1 * time.Second)  
    for range c {  
        fmt.Printf("#goroutines: %d", runtime.NumGoroutine())  
    }  
}

在这个例子中，有一个显而易见的罪魁祸首 —— if false {，但是在更大的程序中，更容易忘记这件事，然后使用 channel 的零值（nil）。

死循环

goroutine 泄露不仅仅是因为 channel 的错误使用造成的。泄露的原因也可能是 I/O 操作上的堵塞，例如发送请求到 API 服务器，而没有使用超时。另一种原因是，程序可以单纯地陷入死循环中。

分析

runtime.NumGoroutine

简单的方式是使用由 runtime.NumGoroutine 返回的值。

net/http/pprof

import (  
    "log"  
    "net/http"  
    _ "net/http/pprof"  
)

...

log.Println(http.ListenAndServe("localhost:6060", nil))

调用 http://localhost:6060/debug/pprof/goroutine?debug=1 ，将会返回带有堆栈跟踪的 goroutine 列表。

runtime/pprof

要将现有的 goroutine 的堆栈跟踪打印到标准输出，请执行以下操作：

import (  
    "os"  
    "runtime/pprof"  
)

...

pprof.Lookup("goroutine").WriteTo(os.Stdout, 1)

gops

> go get -u github.com/google/gops

集成到你的程序中：

import "github.com/google/gops/agent"

...

if err := agent.Start(); err != nil {  
    log.Fatal(err)  
}  
time.Sleep(time.Hour)

> ./bin/gops  
12365   gops    (/Users/mlowicki/projects/golang/spec/bin/gops)  
12336*  lab     (/Users/mlowicki/projects/golang/spec/bin/lab)  
> ./bin/gops vitals -p=12336  
goroutines: 14  
OS threads: 9  
GOMAXPROCS: 4  
num CPU: 4

leaktest

这是用测试来自动检测泄露的方法之一。它基本上是在测试的开始和结束的时候，利用 runtime.Stack 获取活跃 goroutine 的堆栈跟踪。如果在测试完成后还有一些新的 goroutine，那么将其归类为泄露。

分析甚至已经在运行的程序的 goroutine 管理，以避免可能会导致内存不足的泄露，这至关重要。代码在生产上运行数日后，这样的问题通常就会出现，因此它可能会造成真正的损害。

点击原文中的 ❤ 以帮助其他人发现这个问题。如果你想实时获得新的更新，请关注原作者哦~

资源

包 —— Go 编程语言

bufio 包实现了缓存 I/O。它封装一个 io.Reader 或者 io.Writer 对象，创建其他对象（Reader 或者……）
google/gops

gops —— 一个列出和诊断当前运行在你的系统上的 Go 进程的工具。
runtime：检测僵尸 goroutine · 问题 #5308 · golang/go

runtime 可以检测不可达 channel / mutex 等上面的 goroutine 阻塞，然后报告此类问题。这需要一个接口……
fortytw2/leaktest

leaktest - goroutine 泄露检测器。

via: https://medium.com/golangspec/goroutine-leak-400063aef468

作者：Michał Łowicki 译者：ictar 校对：polaris1119

本文由 GCTT 原创编译，Go语言中文网荣誉推出

本文由 GCTT 原创翻译，Go语言中文网首发。也想加入译者行列，为开源做一些自己的贡献么？欢迎加入 GCTT！
翻译工作和译文发表仅用于学习和交流目的，翻译工作遵照 CC-BY-NC-SA 协议规定，如果我们的工作有侵犯到您的权益，请及时联系我们。
欢迎遵照 CC-BY-NC-SA 协议规定转载，敬请在正文中标注并保留原文/译文链接和作者/译者等信息。
文章仅代表作者的知识和看法，如有不同观点，请楼下排队吐槽

有疑问加站长微信联系（非本文作者））

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

6207 次点击 ∙ 1 赞

加入收藏微博

被以下专栏收入，发现更多相似内容

GCTT - Go 中文翻译组收入我的专栏

上一篇：Goroutine+Channel+WaitGroup使用

下一篇：goroutine 所有权和退出

goroutine

channel

runtime

github

0 回复

暂无回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

Goroutine 泄露

发送到一个没有接收者的 channel

从没有发送者的 channel 中接收数据

nil channel

死循环

分析

runtime.NumGoroutine

net/http/pprof

runtime/pprof

gops

leaktest

资源

用户登录

今日阅读排行

一周阅读排行

关注我

Goroutine 泄露

发送到一个没有接收者的 channel

从没有发送者的 channel 中接收数据

nil channel

死循环

分析

runtime.NumGoroutine

net/http/pprof

runtime/pprof

gops

leaktest

资源

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏