以goroutine为例看协程的相关概念

diegodu · · 4267 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

转自 http://wangzhezhe.github.io/blog/2016/02/17/golang-scheduler/

基本上是网上相关文章的梳理，初衷主要是想了解下golang中的goroutine到底是怎么回事，以及相关的起源和概念。后来发现本质上应该是对于golang scheduler的理解，因为goroutine是golang scheduler实现的一个重要模块。这一篇入门吧，基本理解到还行，如果想深入细致了解还是应该看源码，就像参考的那些比较好的链接中的那样。

补充同步异步阻塞非阻塞

同步与异步区别，主要关注的是消息通信机制

所谓同步调用 就是由调用者主动等待这个调用的结果。发出一个调用，在没有得到结果之前，该调用就不返回。一旦调用返回，就得到返回值了。

所谓异步调用 调用在发出之后，这个调用结果就直接返回了。当一个异步调用过程在发出之后，调用者不会立即得到结果，而是在调用发出后，被调用者通过状态、通知来通知调用者，或者通过函数回调来处理这个调用。

阻塞与非阻塞关注的是:程序在等待调用结果（消息返回值）时的状态

阻塞调用 是指调用结果返回之前，当前线程会被挂起。调用线程只有在得到结果之后才会返回。

非阻塞调用 是指，在不能立刻得到结果之前，该调用不会阻塞当前线程，当前线程还会继续执行下去。

注意！！！ 阻塞与非阻塞与是否同步和是否异步无关。

进程线程协程

基本理解

大致上看有这么几个区别：

进程：独立的栈空间，独立的堆空间，进程之间调度由os完成。

线程：独立的栈空间，共享堆空间，内核线程之间调度由os完成。

协程：独立的栈空间，共享堆空间，调度由用户自己控制，本质上有点类似于用户级线程，这些用户级线程的调度也是自己实现的。

这个帖子中排行第一的评论整理得比较通俗，便于理解入门，先整理如下：

首先是并发的起源，最初的动机就是想在宏观上，让多个程序能在同一时间执行，之后就是cpu分片，程序内部多个独立的逻辑流，宏观上多个逻辑流是一同执行的，当然也可以是多个cpu并行。

进一步的问题，多个逻辑流之间的切换怎么办，我的逻辑a计算到一半，逻辑b进来，那么逻辑a的中间结果怎么保存？所以同一个cpu中的多个并发执行的逻辑自然需要进行上下文切换。于是就需要进程的概念了，通过虚拟内存，进程表，等等内容来管理程序的运行和切换。

硬件进一步发展，一台电脑多个cpu于是一个cpu跑一个进程，这个就是并行了，是从时间意义上的完全的共同执行。

由于涉及到并行问题，那自然会有调度问题，怎么调度才能让cpu的利用率更高？这个就是内核应该程序要考虑的事。实质上就是某种权衡把，因为调度也是要开销的，所以就看这种调度是否值得去做。

课本上还是讲得挺明白，由于为了满足上述并发的需求，进程最为一个可拥有资源的，可独立调度和分派的基本单位而存在，但是进程的创建，撤销，切换其实都是需要不少开销的，如果进程切换过于频繁，系统资源就会被频繁开销所占去。于是控制粒度再进一步细化，即把“拥有资源”和“独立调度”两个属性分开来。线程仅仅拥有很小的一部分资源，共享线程的资源。其开销显著地小于进程的切换，操作系统的书里，都说的很细致，就不再赘述。

把调度的那部分功能从内核中拿出来，在进程中自己去实现一个逻辑流调度的功能，这样既可以实现并发的优势，又可以避免反复的系统调用，减少线程切换造成的开销，这就叫做用户态线程，相当于是调度功能的更细粒度的实现。

用户态线程需要考虑的问题：1、遇到阻塞式I/O会导致整个进程被挂起 2、由于缺乏时钟中断（具体查看相关内容时钟中断的时候cpu可以用来进行进程切换）如果一种实现使得每个线程需要自己通过调用某个方法，主动交出控制权。那么我们就称这种用户态线程是协作式的，就是所谓的协程。

具体在这篇文章可以看到，通过这个文章应该清楚这几个问题:协程是如何被提出的，为何开始的时候没有被普遍采用，以及后来又是如何兴起的。以及对于“协程的思想本质上就是控制流的主动让出(yield)和恢复(resume)机制”的理解，以及协程在不同语言中的大概的实现方式。

关于采用协程的优势，参考这里，原文中也列出了python实现协程思想的一个模型。

协程之间的切换是由程序自身控制的，没有线程切换的额外开销，和多线程相比，线程数目越多，协程的性能优势就越明显。
不需要多线程的锁机制（因为只有一个线程），怎么利用多核CPU?最简单的方式是多进程+协程，比如在Golang程序开始的时候往往需要制定下并发进程的数目，类似这样：

if *maxProcs < 1 {
numProcs = runtime.NumCPU()
} else {
numProcs = *maxProcs
}
runtime.GOMAXPROCS(numProcs)

golang的协程模型的实现

其实核心就是调度器应该如何实现，这的确是一个比较复杂的问题。这里主要参考这个。其中的内容是在Golang的1.1版本的基础上经行的分析，后面的版本可能有些地方已经进行了改进。

Golang runtime的时候 scheduler 需要完成哪些工作？

首先要明确下，我们为什么需要scheduler。既然os本身可以调度线程，为何还需要在用户空间实现一个调度器？

POSIX Thread API 实际上是对于已经存在的Unix process model 的一个逻辑扩展。这使得在控制threads的时候，用些地方和控制processes比较类似。threads可以有它们自己的signal mask，有cpu亲和力(CPU affinity),可以被cgroup机制进行控制，并且可以查询到它们都使用了哪些资源。所有的对于threads的这些额外的控制特性都会增加额外的开销。对于Golang使用goroutine来说，这些特性是不需要的。

从Golang本身的角度来说，如果让os去做schedule，这样粒度不是很细，schedule的时机选择也并不是最佳的，因为os无法知道golang在runtime时候的一些更进一步的信息。比如，Golang的GC在启动的时候需要保证以下两个方面

1、所有的threads都停止

2、memory必须达到一致的状态（这里的memory consistency到底指的什么？）这就需要golang在runtime的时候等到所有的运行的threads都到达memory consistent的时候才能启动GC。

可以想象到，如多有许多threads在某种程度上“随机”的时间点被进行调度(os的方式下根据时钟中断？)，就会经常需要去等待这些threads,等它们达到一个consistent state。如果是golang 自身实现的调度器，它可以在所有threads达到memory consistency的状态的时候才决定进行调度，因此在调度时机的选取上，这样更为高效。即是说，当我们准备进行Garbage Collection的时候，只需要等待那些正在被运行的进程停下来就可以了。

(gopher china 2016 Dave slide )每个goroutine至少会占用2k的内存空间，2048 * 1,000,000 goroutines == 2Gb，也就是说，2G内存的机器，最多可以承担100万的goroutine，所以在每次使用go关键字的时候，明确goroutine会怎样退出，如果无法明确的回答这个问题，可能会导致潜在的内存泄露，当然，有些goroutine会一直运行，直到main函数运行结束，这也是gc优化的一个技巧。

所以：

Never start a goroutine without knowing how it will stop

Golang 中的调度器模型基本介绍

通常情况下有三种线程模型：

N:1 N个用户级线程以及一个内核级线程。这种模式下，用户级线程之间的切换可以很快，但是不能很好的利用多核的优势。
1:1 一个用户级线程对应一个内核级线程。可以利用多核的优势，但是线程切换比较慢，因为需系统调用，要进行trap操作。

Golang中的调度器采用 M:N 的方式。既要利用多核cpu系统的特性，同时还要增强上下文切换的速度。缺点就是，这会使得调度器的实现变得复杂。

可以看到golang scheduler中包含以下的基本元素：

三角形M 代表一个os thread，这个thread被os管理，工作方式就像通常的POSIX thread那样。

圆形G 代表一个goroutine，它有自己的stack，instruction pointer，程序计数器，以及它所在的M等信息，以及一些调度goroutine所必须的一些资源，这些信息就是goroutine要放弃cpu的时候所需要保存的信息，比如正在阻塞的channel等等，下次被调度到的时候，这些信息要被重新load到对应的cpu寄存器中。

矩形P 代表一个用于调度的上下文context，从理解上，可以认为这是一个运行在单独thread中的scheduler或者理解成一个局部的Processor处理器。这个组件很关键，是从N:1调度器到M:N调度的器的关键部分。

上图是一个一般情况，可以看到有两个内核thread（M），每一个内核thread都持有一个context(P)，每一个内核线程还运行着一个goroutine，为了运行goroutines，内核线程必须要持有一个context。

context的数量是在goroutine运行的时候由 GOMAXPROCS 这个环境变量设置进去的，通过runtime的GOMAXPROCS()函数可以设置这个值。通常情况下，这个值在程序运行的过程中是不变的，即使说，GOMAXPROCS 是实际负责运行Golang代码的组件，可以通过其数目来调整实际的GO process的数目。（GOMAXPROCS 就是图中的那个P 到底是什么东西？理解上感觉像是个容器一样？里面装着的golang 实际运行代码可以更换但是离不开这个运行的环境）

上图中灰色标记的goroutine并没有在运行，它们是准备被调度的（not running but ready to scheduled）。它们被分配在一个个的list中，这些list叫做runqueues。新的goroutine会被添加到runqueues的尾部。在调度点的时候，当context需要运行一个goroutine，一个goroutine就会从list中弹出来，之后设置好对应的stack以及instruction pointer之后这个goroutine就开始运行了。

为了减少并发冲突，每个context都有它们自己的一个runqueue（旧的版本貌似只有一个全局的runqueue），当然以上情况只是最一般的情况，实际比这要更复杂一些。

发生系统调用syscall的情况

为什么必须要一个context（即使图中的P）？为何不能直接让requeues在thread上运行？当某个正在running的线程陷入阻塞的时候，这个p可以临时转移到新的线程上去。

比如某个gourutine正在进行系统调用，因为线程不能一边执行代码，一边阻塞在系统调用上，所以p可以带着gourutine转移到其他的os线程上去，如下图

这里我们可以看到，原来的内核线程M0放弃了它本身的context，M0陷入了阻塞，之后这个context又与新的内核线程M1绑定在了一起。调度器可以保证有足够的thread来运行这些context。原来的M0仍然持有者之前的那个goroutine，因为本质上来说，它还是执行着的，虽然被os阻塞。

当syscall的结果返回，M0必须要想办法持有一个context来运行之前的goroutine。因为按照之前分析的，如果goroutine想要运行，必须要有一个context作为支撑。通常的方式是steal一个context过来，如果暂时没有可用的context，当前的这个goroutine可能会被放到全局的runqueue中，这个thread会把自己放到thread cache中变成sleep状态。

当context的local runqueue中已经没有goroutine了，它们可能会从global runqueue中获取一个goroutine过来。context也可能会周期性地检查runqueue看其中是否还有goroutine。否则全局runqueue中的goroutine可能会永远无法运行，会被"饿死"（context的local runqueue一直有goroutine在运行）。

对于syscall的处理方式决定了golang在运行起来的时候，本身就是多线程的，即使GOMAXPROCS的数目被设置为1，因为在发生syscall的时候，p会在一个新启动的thread上继续运行。可以知道在golang中不会直接让用户去创建一个os层面的thread，这个工作完全是由runtime根据实际情况来决定何时创建thread。用户能创建的仅仅只goroutine，让用户管理的资源越少，操作的东西越简单，用户就会越happy。

steal work

work stealing的策略应该也是一种调度算法，大致上是这样:如果context上的goroutine数目不平衡，golang的调度器也会进行相应的处理，就是所谓的"steal work"。一种情况是从全局requeue中获取goroutine继续运行，另一种情况是从其他的context中steal一些过来，比如从其他的context的local requeue中steal一半数目的goroutine过来，就像下图中的这样。这样可以保证每个context都有一些工作需要完成，这样也可以保证所有的threads都发挥出了它们最大的性能。

调度时间点的选取

这个参考的这篇，通过之前的分析可以看到，采用自己实现的调度器的一个重要方面就是由runtime自己决定调度的时机，那么具体情况是怎么样的？

这里罗列写可能的基本情况:

runtime.park函数被调用，可能会使得goroutine变为waiting状态，放弃cpu。channel读写操作的时候，定时器中，网络poll都可能会调用runtime.park函数。
runtime·gosched函数也可以让当前goroutine放弃cpu，但和park完全不同；gosched是将goroutine设置为runnable状态，然后放入到调度器全局等待队列（global runqueue）。
有些系统调用会触发重新调度。比如之前提到的syscall的情况，runtime的时候会有一个goroutine负责系统监控，对goroutine进行扫描，如果发现某一个goroutine处在syscall的状态下，就会像前面分析的那样，创建一个新的M，把那个P抢过来，让这个P开始运行goroutine。等到系统调用结束，原来的goroutine发现自己这边没有P，无法执行，就会被放到全局的requeue上，之后原先的线程也会变为sleep的状态。

总结

threads粒度太粗，会有诸多额外开销 -> goroutine不需要这些开销，它们需要更细粒度的控制 -> golang中scheduler的模型（几种线程模型 M P G 含义）-> (M P G 优点) 某个G陷入阻塞的时候 P可以带着其他的G转移到其他的M上，当原先的G系统调用完成以后，会从另外一个地方steal一个P回来 -> 提高资源利用率

要通过golang scheduler的基本模型理解其本质的东西，即最终目的是要使得所有资源的利用率最大，使用到其他地方，应该也要有些启发。比如k8s的调度的策略。

实际实现当然是一个很复杂的过程，比如这篇从更细节的层面分析了golang的调度器，也比较有参考价值。

感觉要想深入了解，还是应该把这些本质的东西弄清楚一点。比较推荐这个可以按照大牛的思路一块块地了解相关内容。

还有一个深入了解语言层面的方式，比如好多人会发帖，说这个语言怎么样，有什么的缺陷，等等，可以顺藤摸瓜，顺着这些人的思路走下去，看看到底细节上是怎样的，这样也能提升好多。

比如可以参考这个

参考资料

golang与jvm中并发模型的探讨

http://www.nyankosama.com/2015/04/03/java-goroutine/

协程的一些介绍

http://www.cnblogs.com/wonderKK/p/4062591.html http://blog.youxu.info/2014/12/04/coroutine/

zhihu相关帖子

http://www.zhihu.com/question/20511233

https://www.zhihu.com/question/20862617

http://www.zhihu.com/question/32218874

协程的过去现在未来（从cobol到协程的整个发展演变比较经典） http://www.tuicool.com/articles/BNvUfeb

http://www.liaoxuefeng.com/wiki/001374738125095c955c1e6d8bb493182103fac9270762a000/0013868328689835ecd883d910145dfa8227b539725e5ed000

大牛的博客里面有许多关于golang的文章比如gc之类的

http://morsmachine.dk/

牛人的golang学习笔记（从源码角度分析）

https://github.com/qyuhen/book

关于golang的调度器（也写得比较通俗）

http://skoo.me/go/2013/11/29/golang-schedule/

Posted by wangzhe Feb 17th, 2016 3:53 pm golang

有疑问加站长微信联系（非本文作者）

本文来自：博客园

感谢作者：diegodu

查看原文：以goroutine为例看协程的相关概念

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

4267 次点击 ∙ 1 赞

加入收藏微博

收入我的专栏

上一篇：golang 垃圾回收 gc

下一篇：VS code golang 开发环境搭建

goroutine

线程

context

runtime

0 回复

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

以goroutine为例看协程的相关概念

补充同步异步阻塞非阻塞

进程线程协程

基本理解

golang的协程模型的实现

总结

参考资料

用户登录

今日阅读排行

一周阅读排行

关注我

补充同步异步阻塞非阻塞

进程线程协程

基本理解

golang的协程模型的实现

总结

参考资料

以goroutine为例看协程的相关概念

补充 同步 异步 阻塞 非阻塞

进程 线程 协程

基本理解

golang的协程模型的实现

总结

参考资料

用户登录

今日阅读排行

一周阅读排行

关注我

给该专栏投稿 写篇新文章

收入到我管理的专栏 新建专栏

补充 同步 异步 阻塞 非阻塞

进程 线程 协程

基本理解

golang的协程模型的实现

总结

参考资料

补充同步异步阻塞非阻塞

进程线程协程

给该专栏投稿写篇新文章

收入到我管理的专栏新建专栏

补充同步异步阻塞非阻塞

进程线程协程