Go channel系列:
channel基础
channel用于goroutines之间的通信,让它们之间可以进行数据交换。像管道一样,一个goroutine_A向channel_A中放数据,另一个goroutine_B从channel_A取数据。
channel是指针类型的数据类型,通过make来分配内存。例如:
ch := make(chan int)
这表示创建一个channel,这个channel中只能保存int类型的数据。也就是说一端只能向此channel中放进int类型的值,另一端只能从此channel中读出int类型的值。
需要注意,chan TYPE
才表示channel的类型。所以其作为参数或返回值时,需指定为xxx chan int
类似的格式。
向ch这个channel放数据的操作形式为:
ch <- VALUE
从ch这个channel读数据的操作形式为:
<-ch // 从ch中读取一个值
val = <-ch
val := <-ch // 从ch中读取一个值并保存到val变量中
val,ok = <-ch // 从ch读取一个值,判断是否读取成功,如果成功则保存到val变量中
其实很简单,当ch出现在<-
的左边表示send,当ch出现在<-
的右边表示recv。
例如:
package main
import (
"fmt"
"time"
)
func main() {
ch := make(chan string)
go sender(ch) // sender goroutine
go recver(ch) // recver goroutine
time.Sleep(1e9)
}
func sender(ch chan string) {
ch <- "malongshuai"
ch <- "gaoxiaofang"
ch <- "wugui"
ch <- "tuner"
}
func recver(ch chan string) {
var recv string
for {
recv = <-ch
fmt.Println(recv)
}
}
输出结果:
malongshuai
gaoxiaofang
wugui
tuner
上面激活了一个goroutine用于执行sender()函数,该函数每次向channel ch中发送一个字符串。同时还激活了另一个goroutine用于执行recver()函数,该函数每次从channel ch中读取一个字符串。
注意上面的recv = <-ch
,当channel中没有数据可读时,recver goroutine将会阻塞在此行。由于recver中读取channel的操作放在了无限for循环中,表示recver goroutine将一直阻塞,直到从channel ch中读取到数据,读取到数据后进入下一轮循环由被阻塞在recv = <-ch
上。直到main中的time.Sleep()指定的时间到了,main程序终止,所有的goroutine将全部被强制终止。
因为receiver要不断从channel中读取可能存在的数据,所以receiver一般都使用一个无限循环来读取channel,避免sender发送的数据被丢弃。
channel的属性和分类
channel的3种操作
每个channel都有3种操作:send、receive和close
- send:表示sender端的goroutine向channel中投放数据
- receive:表示receiver端的goroutine从channel中读取数据
- close:表示关闭channel
- 关闭channel后,send操作将导致painc
- 关闭channel后,recv操作将返回对应类型的0值以及一个状态码false
- close并非强制需要使用close(ch)来关闭channel,在某些时候可以自动被关闭
- 如果使用close(),建议条件允许的情况下加上defer
- 只在sender端上显式使用close()关闭channel。因为关闭通道意味着没有数据再需要发送
- 关闭channel后,send操作将导致painc
例如,判断channel是否被关闭:
val, ok := <-counter
if ok {
fmt.Println(val)
}
因为关闭通道也会让recv成功读取(只不过读取到的值为类型的空值),使得原本阻塞在recv操作上的goroutine变得不阻塞,借此技巧可以实现goroutine的执行先后顺序。具体示例见后文:指定goroutine的执行顺序。
channel的两种分类
channel分为两种:unbuffered channel和buffered channel
- unbuffered channel:阻塞、同步模式
- sender端向channel中send一个数据,然后阻塞,直到receiver端将此数据receive
- receiver端一直阻塞,直到sender端向channel发送了一个数据
- sender端向channel中send一个数据,然后阻塞,直到receiver端将此数据receive
- buffered channel:非阻塞、异步模式
- sender端可以向channel中send多个数据(只要channel容量未满),容量满之前不会阻塞
- receiver端按照队列的方式(FIFO,先进先出)从buffered channel中按序receive其中数据
- sender端可以向channel中send多个数据(只要channel容量未满),容量满之前不会阻塞
可以认为阻塞和不阻塞是由channel控制的,无论是send还是recv操作,都是在向channel发送请求:
- 对于unbuffered channel,sender发送一个数据,channel暂时不会向sender的请求返回ok消息,而是等到receiver准备接收channel数据了,channel才会向sender和receiver双方发送ok消息。在sender和receiver接收到ok消息之前,两者一直处于阻塞。
- 对于buffered channel,sender每发送一个数据,只要channel容量未满,channel都会向sender的请求直接返回一个ok消息,使得sender不会阻塞,直到channel容量已满,channel不会向sender返回ok,于是sender被阻塞。对于receiver也一样,只要channel非空,receiver每次请求channel时,channel都会向其返回ok消息,直到channel为空,channel不会返回ok消息,receiver被阻塞。
buffered channel的两个属性
buffered channel有两个属性:容量和长度:和slice的capacity和length的概念是一样的
- capacity:表示bufffered channel最多可以缓冲多少个数据
- length:表示buffered channel当前已缓冲多少个数据
- 创建buffered channel的方式为
make(chan TYPE,CAP)
unbuffered channel可以认为是容量为0的buffered channel,所以每发送一个数据就被阻塞。注意,不是容量为1的buffered channel,因为容量为1的channel,是在channel中已有一个数据,并发送第二个数据的时候才被阻塞。
换句话说,send被阻塞的时候,其实是没有发送成功的,只有被另一端读走一个数据之后才算是send成功。对于unbuffered channel来说,这是send/recv的同步模式。而buffered channel则是在每次发送数据到通道的时候,(通道)都向发送者返回一个消息,容量未满的时候返回成功的消息,发送者因此而不会阻塞,容量已满的时候因为已满而迟迟不返回消息,使得发送者被阻塞。
实际上,当向一个channel进行send的时候,先关闭了channel,再读取channel时会发现错误在send,而不是recv。它会提示向已经关闭了的channel发送数据。
func main() {
counter := make(chan int)
go func() {
counter <- 32
}()
close(counter)
fmt.Println(<-counter)
}
输出报错:
panic: send on closed channel
所以,在Go的内部行为中,send和recv是一个整体行为,数据未读就表示未send成功。
两种特殊的channel
有两种特殊的channel:nil channel和channal类型的channel。
当未为channel分配内存时,channel就是nil channel,例如var ch1 chan int
。nil channel会永远阻塞对该channel的读、写操作。
nil channel在某些时候有些妙用,例如在select(关于select,见后文)的某个case分支A将其它某case分支B所操作的channel突然设置为nil,这将会禁用case分支B。
当channel的类型为一个channel时,就是channel的channel,也就是双层通道。例如:
var chch1 chan chan int
channel的channel是指通道里的数据是通道,可以认为通道里面嵌套了一个或多个通道:只能将整个通道发送到外层通道,读取外层通道时获取到的是内层通道,然后可以操作内层通道。
// 发送通道给外层通道
chch1 <-ch1
chch1 <-ch2
// 从外层通道取出内层通道
c <-chch1
// 操作取出的内层通道
c <-123
val := <-c
channel of channel的妙用之一是将外层通道作为通道的加工厂:在某个goroutine中不断生成通道,在其它goroutine可以不断取出通道来操作。
死锁(deadlock)
当channel的某一端(sender/receiver)期待另一端的(receiver/sender)操作,另一端正好在期待本端的操作时,也就是说两端都因为对方而使得自己当前处于阻塞状态,这时将会出现死锁问题。
更通俗地说,只要所有goroutine都被阻塞,就会出现死锁。
比如,在main函数中,它有一个默认的goroutine,如果在此goroutine中创建一个unbuffered channel,并在main goroutine中向此channel中发送数据并直接receive数据,将会出现死锁:
package main
import (
"fmt"
)
func main (){
goo(32)
}
func goo(s int) {
counter := make(chan int)
counter <- s
fmt.Println(<-counter)
}
在上面的示例中,向unbuffered channel中send数据的操作counter <- s
是在main goroutine中进行的,从此channel中recv的操作<-counter
也是在main goroutine中进行的。send的时候会直接阻塞main goroutine,使得recv操作无法被执行,go将探测到此问题,并报错:
fatal error: all goroutines are asleep - deadlock!
goroutine 1 [chan send]:
要修复此问题,只需将send操作放在另一个goroutine中执行即可:
package main
import (
"fmt"
)
func main() {
goo(32)
}
func goo(s int) {
counter := make(chan int)
go func() {
counter <- s
}()
fmt.Println(<-counter)
}
或者,将counter设置为一个容量为1的buffered channel:
counter := make(chan int,1)
这样放完一个数据后send不会阻塞(被recv之前放第二个数据才会阻塞),可以执行到recv操作。
unbuffered channel同步通信示例
下面通过sync.WaitGroup类型来等待程序的结束,分析多个goroutine之间通信时状态的转换。因为创建的channel是unbuffered类型的,所以send和recv都是阻塞的。
package main
import (
"fmt"
"sync"
)
// wg用于等待程序执行完成
var wg sync.WaitGroup
func main() {
count := make(chan int)
// 增加两个待等待的goroutines
wg.Add(2)
fmt.Println("Start Goroutines")
// 激活一个goroutine,label:"Goroutine-1"
go printCounts("Goroutine-1", count)
// 激活另一个goroutine,label:"Goroutine-2"
go printCounts("Goroutine-2", count)
fmt.Println("Communication of channel begins")
// 向channel中发送初始数据
count <- 1
// 等待goroutines都执行完成
fmt.Println("Waiting To Finish")
wg.Wait()
fmt.Println("\nTerminating the Program")
}
func printCounts(label string, count chan int) {
// goroutine执行完成时,wg的计数器减1
defer wg.Done()
for {
// 从channel中接收数据
// 如果无数据可recv,则goroutine阻塞在此
val, ok := <-count
if !ok {
fmt.Println("Channel was closed:",label)
return
}
fmt.Printf("Count: %d received from %s \n", val, label)
if val == 10 {
fmt.Printf("Channel Closed from %s \n", label)
// Close the channel
close(count)
return
}
// 输出接收到的数据后,加1,并重新将其send到channel中
val++
count <- val
}
}
上面的程序中,激活了两个goroutine,激活这两个goroutine后,向channel中发送一个初始数据值1,然后main goroutine将因为wg.Wait()等待2个goroutine都执行完成而被阻塞。
再看这两个goroutine,这两个goroutine执行完全一样的函数代码,它们都接收count这个channel的数据,但可能是goroutine1先接收到channel中的初始值1,也可能是goroutine2先接收到初始值1。接收到数据后输出值,并在输出后对数据加1,然后将加1后的数据再次send到channel,每次send都会将自己这个goroutine阻塞(因为unbuffered channel),此时另一个goroutine因为等待recv而执行。当加1后发送给channel的数据为10之后,某goroutine将关闭count channel,该goroutine将退出,wg的计数器减1,另一个goroutine因等待recv而阻塞的状态将因为channel的关闭而失败,ok状态码将让该goroutine退出,于是wg的计数器减为0,main goroutine因为wg.Wait()而继续执行后面的代码。
使用for range迭代channel
前面都是在for无限循环中读取channel中的数据,但也可以使用range来迭代channel,它会返回每次迭代过程中所读取的数据,直到channel被关闭。必须注意,只要channel未关闭,range迭代channel就会一直被阻塞。
例如,将上面示例中的printCounts()改为for-range的循环形式。
func printCounts(label string, count chan int) {
defer wg.Done()
for val := range count {
fmt.Printf("Count: %d received from %s \n", val, label)
if val == 10 {
fmt.Printf("Channel Closed from %s \n", label)
close(count)
return
}
val++
count <- val
}
}
多个"管道":输出作为输入
channel是goroutine与goroutine之间通信的基础,一边产生数据放进channel,另一边从channel读取放进来的数据。可以借此实现多个goroutine之间的数据交换,例如goroutine_1->goroutine_2->goroutine_3
,就像bash的管道一样,上一个命令的输出可以不断传递给下一个命令的输入,只不过golang借助channel可以在多个goroutine(如函数的执行)之间传,而bash是在命令之间传。
以下是一个示例,第一个函数getRandNum()用于生成随机整数,并将生成的整数放进第一个channel ch1中,第二个函数addRandNum()用于接收ch1中的数据(来自第一个函数),将其输出,然后对接收的值加1后放进第二个channel ch2中,第三个函数printRes接收ch2中的数据并将其输出。
如果将函数认为是Linux的命令,则类似于下面的命令行:ch1相当于第一个管道,ch2相当于第二个管道
getRandNum | addRandNum | printRes
以下是代码部分:
package main
import (
"fmt"
"math/rand"
"sync"
)
var wg sync.WaitGroup
func main() {
wg.Add(3)
// 创建两个channel
ch1 := make(chan int)
ch2 := make(chan int)
// 3个goroutine并行
go getRandNum(ch1)
go addRandNum(ch1, ch2)
go printRes(ch2)
wg.Wait()
}
func getRandNum(out chan int) {
// defer the wg.Done()
defer wg.Done()
var random int
// 总共生成10个随机数
for i := 0; i < 10; i++ {
// 生成[0,30)之间的随机整数并放进channel out
random = rand.Intn(30)
out <- random
}
close(out)
}
func addRandNum(in,out chan int) {
defer wg.Done()
for v := range in {
// 输出从第一个channel中读取到的数据
// 并将值+1后放进第二个channel中
fmt.Println("before +1:",v)
out <- (v + 1)
}
close(out)
}
func printRes(in chan int){
defer wg.Done()
for v := range in {
fmt.Println("after +1:",v)
}
}
指定channel的方向
上面通过两个channel将3个goroutine连接起来,其中起连接作用的是第二个函数addRandNum()。在这个函数中使用了两个channel作为参数:一个channel用于接收、一个channel用于发送。
其实channel类的参数变量可以指定数据流向:
in <-chan int
:表示channel in通道只用于接收数据
out chan<- int
:表示channel out通道只用于发送数据
只用于接收数据的通道<-chan
不可被关闭,因为关闭通道是针对发送数据而言的,表示无数据再需发送。对于recv来说,关闭通道是没有意义的。
所以,上面示例中三个函数可改写为:
func getRandNum(out chan<- int) {
...
}
func addRandNum(in <-chan int, out chan<- int) {
...
}
func printRes(in <-chan int){
...
}
buffered channel异步队列请求示例
下面是使用buffered channel实现异步处理请求的示例。
在此示例中:
- 有(最多)3个worker,每个worker是一个goroutine,它们有worker ID。
- 每个worker都从一个buffered channel中取出待执行的任务,每个任务是一个struct结构,包含了任务id(JobID),当前任务的队列号(ID)以及任务的状态(worker是否执行完成该任务)。
- 在main goroutine中将每个任务struct发送到buffered channel中,这个buffered channel的容量为10,也就是最多只允许10个任务进行排队。
- worker每次取出任务后,输出任务号,然后执行任务(run),最后输出任务id已完成。
- 每个worker执行任务的方式很简单:随机睡眠0-1秒钟,并将任务标记为完成。
以下是代码部分:
package main
import (
"fmt"
"math/rand"
"sync"
"time"
)
type Task struct {
ID int
JobID int
Status string
CreateTime time.Time
}
func (t *Task) run() {
sleep := rand.Intn(1000)
time.Sleep(time.Duration(sleep) * time.Millisecond)
t.Status = "Completed"
}
var wg sync.WaitGroup
// worker的数量,即使用多少goroutine执行任务
const workerNum = 3
func main() {
wg.Add(workerNum)
// 创建容量为10的buffered channel
taskQueue := make(chan *Task, 10)
// 激活goroutine,执行任务
for workID := 0; workID <= workerNum; workID++ {
go worker(taskQueue, workID)
}
// 将待执行任务放进buffered channel,共15个任务
for i := 1; i <= 15; i++ {
taskQueue <- &Task{
ID: i,
JobID: 100 + i,
CreateTime: time.Now(),
}
}
close(taskQueue)
wg.Wait()
}
// 从buffered channel中读取任务,并执行任务
func worker(in <-chan *Task, workID int) {
defer wg.Done()
for v := range in {
fmt.Printf("Worker%d: recv a request: TaskID:%d, JobID:%d\n", workID, v.ID, v.JobID)
v.run()
fmt.Printf("Worker%d: Completed for TaskID:%d, JobID:%d\n", workID, v.ID, v.JobID)
}
}
select多路监听
很多时候想要同时操作多个channel,比如从ch1、ch2读数据。Go提供了一个select语句块,它像switch一样工作,里面放一些case语句块,用来轮询每个case语句块的send或recv情况。
select
用法格式示例:
select {
// ch1有数据时,读取到v1变量中
case v1 := <-ch1:
...
// ch2有数据时,读取到v2变量中
case v2 := <-ch2:
...
// 所有case都不满足条件时,执行default
default:
...
}
defalut语句是可选的,不允许fall through行为,但允许case语句块为空块。select会被return、break关键字中断:return是退出整个函数,break是退出当前select。
select的行为模式主要是对channel是否可读进行轮询,但也可以用来向channel发送数据。它的行为如下:
- 如果所有的case语句块评估时都被阻塞,则阻塞直到某个语句块可以被处理
- 如果多个case同时满足条件,则随机选择一个进行处理,对于这一次的选择,其它的case都不会被阻塞,而是处理完被选中的case后进入下一轮select(如果select在循环中)或者结束select(如果select不在循环中或循环次数结束)
- 如果存在default且其它case都不满足条件,则执行default。所以default必须要可执行而不能阻塞
如果有所疑惑,后文的"select超时时间"有更有助于理解select的说明和示例。
所有的case块都是按源代码书写顺序进行评估的。当select未在循环中时,它将只对所有case评估一次,这次结束后就结束select。某次评估过程中如果有满足条件的case,则所有其它case都直接结束评估,并退出此次select。
其实如果注意到select语句是在某一个goroutine中评估的,就不难理解只有所有case都不满足条件时,select所在goroutine才会被阻塞,只要有一个case满足条件,本次select就不会出现阻塞的情况。
需要注意的是,如果在select中执行send操作,则可能会永远被send阻塞。所以,在使用send的时候,应该也使用defalut语句块,保证send不会被阻塞。如果没有default,或者能确保select不阻塞的语句块,则迟早会被send阻塞。在后文有一个select中send永久阻塞的分析:双层channel的一个示例。
一般来说,select会放在一个无限循环语句中,一直轮询channel的可读事件。
下面是一个示例,pump1()和pump2()都用于产生数据(一个产生偶数,一个产生奇数),并将数据分别放进ch1和ch2两个通道,suck()则从ch1和ch2中读取数据。然后在无限循环中使用select轮询这两个通道是否可读,最后main goroutine在1秒后强制中断所有goroutine。
package main
import (
"fmt"
"time"
)
func main() {
ch1 := make(chan int)
ch2 := make(chan int)
go pump1(ch1)
go pump2(ch2)
go suck(ch1, ch2)
time.Sleep(1e9)
}
func pump1(ch chan int) {
for i := 0; i <= 30; i++ {
if i%2 == 0 {
ch <- i
}
}
}
func pump2(ch chan int) {
for i := 0; i <= 30; i++ {
if i%2 == 1 {
ch <- i
}
}
}
func suck(ch1 chan int, ch2 chan int) {
for {
select {
case v := <-ch1:
fmt.Printf("Recv on ch1: %d\n", v)
case v := <-ch2:
fmt.Printf("Recv on ch2: %d\n", v)
}
}
}
有疑问加站长微信联系(非本文作者)