弄懂goroutine调度原理

939496716 · 2019-09-12 19:35:26 · 3535 次点击 · 预计阅读时间 3 分钟 · 大约8小时之前开始浏览

这是一个创建于 2019-09-12 19:35:26 的文章，其中的信息可能已经有所发展或是发生改变。

原文地址：https://bingjian-zhu.github.io/2019/09/12/%E5%BC%84%E6%87%82goroutine%E8%B0%83%E5%BA%A6%E5%8E%9F%E7%90%86/

goroutine简介

golang语言作者Rob Pike说，“Goroutine是一个与其他goroutines 并发运行在同一地址空间的Go函数或方法。一个运行的程序由一个或更多个goroutine组成。它与线程、协程、进程等不同。它是一个goroutine“。

goroutine通过通道来通信，而协程通过让出和恢复操作来通信；

goroutine 通过Golang 的调度器进行调度，而协程通过程序本身调度；

简单的说就是Golang自己实现了协程并叫做goruntine（本文称Go协程），且比协程更强大。

goroutine调度原理

上面说到Go协程是通过Golang的调度器进行调度的，其中调度器的线程模型为两级线程模型。

有关两级线程模型的介绍，可以看这篇文章

我们来看下Golang实现的两级线程模型是怎样的。首先要知道这三个字母代表的含义

M：代表内核级的线程
P：全程Processor，代表运行Go协程所需要的资源（上下文环境）
G：代表Go协程我们先看下为实现调度Golang定义了这些数据结构存M，P，G

名称	作用范围	描述
全局M列表	Go的运行时	存放所有M的单向链表
全局P列表	Go的运行时	存放所有P的数组
全局G列表	Go的运行时	存放所有G的切片
调度器的空闲M列表	调度器	存放空闲M的单向链表
调度器的空闲P列表	调度器	存放空闲P的单向链表
调度器的自由G列表	调度器	存放自由G的单向链表（有两个）
调度器的可运行G队列	调度器	存放可运行G的队列
P的自由G列表	本地P	存放当前P中自由G的单向链表
P的可运行G队列	本地P	存放当前P中可运行G的队列

然后从上往下解析Go的两级线程模型图

（1）M和内核线程之间是一对一的关系，一个M在其生命周期中，只会和一个内核线程关联，所以不会出现对内核线程的频繁切换；

Golang的运行时执行系统监控和垃圾回收等任务时候会导致创建M，M空闲时不会被销毁，而是放到一个调度器的空闲M列表中，等待与P关联，M默认数量为10000

（2）P和M之间是多对多的关系，P和G之间是一对多的关系，他们的关联是易变的，由Golang的调度器完成调度；

Golang的运行时按规则调度，让P和不同的M建立或断开关联，使得P中的G能够及时获得运行时机

（3）P的数量默认为CPU总核心数，最大为256，当P没有可运行的G时候（P的可运行G队列为空），P会被放到调度器的空闲P列表中，等待M与它关联；

P有可能会被销毁，如运行时用runtime.GOMAXPROCS把P的数量从32降到16时，剩余16个会被销毁，它们原来的G会先转到调度器可运行的G队列和自由G列表

（4）每个P中有可运行的G队列（如图中最下面的那行G）和自由G列表（图中未画出来），当G的代码执行完后，该G不会被销毁，而是被放到P的自由G列表或调度器的自由G列表。如果程序新建了Go协程，调度器会在自由G列表中取一个G，然后把Go协程的函数赋值到G中（如果自由G列表为空，就创建一个G）；

可见Golang调度器在调度时很大程度复用了M，P，G

（5）在Go程序初始化后，调度器首先进行一轮调度，此时用M去搜索可运行的G。其中我们的main函数也是一个G，找到可运行的G后就执行它；

至于怎么找可运行的G呢？答案是到处找，想尽办法找（这里只列出一部分地方）。

从本地P的可运行的G队列找

从调度器的可运行的G队列找

从其他P的可运行的G队列找

（6）P的可运行G队列最大只能存放长度为256的G，当队列满后，调度器会把一半的G转到调度器的可运行G队列。

系统监控

上面大概描述了关于goroutine调度的流程。现在还存在一个问题，那就是当Go协程很多（并发量大）时候，显然G是不能一直执行下去的，因为也需要把执行机会留给其他的G。此时Golang运行时的系统监控就起作用了。一般情况，当G运行时间超过10ms后，该G就会被系统告知需要停止了，让其他G运行。（这里情况比较复杂，并不能确保每个G都能被公平执行）