Go 内存模型 并发可见性

ShootHzj · · 736 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

参考资料

https://golang.org/ref/mem

TLTR

  • 协程之间的数据可见性满足HappensBefore法则,并具有传递性
  • 如果包 p 导入包 q,则 q 的 init 函数的完成发生在任何 p 的操作开始之前
  • main.main 函数的启动发生在所有 init 函数完成之后
  • go语句启动新的协程发生在新协程启动开始之前
  • go协程的退出并不保证发生在任何事件之前
  • channel上的发送发生在对应channel接收之前
  • 无bufferchannel的接收发生在发送操作完成之前
  • 对于容量为C的buffer channel来说,第k次从channel中接收,发生在第k + C次发送完成之前。
  • 对于任何的sync.Mutex或者sync.RWMutex变量,且有n<m,第n个调用UnLock一定发生在mLock`之前。
  • 从 once.Do(f) 对 f() 的单个调用返回在任何一个 once.Do(f) 返回之前。
  • 如果两个动作不满足HappensBefore,则顺序无法预测

介绍

Go内存模型指定了在何种条件下可以保证在一个 goroutine 中读取变量时观察到不同 goroutine 中写入该变量的值。

建议

通过多个协程并发修改数据的程序必须将操作序列化。为了序列化访问,通过channel操作或者其他同步原语(syncsync/atomic)来保护数据。

如果你必须要阅读本文的其他部分才能理解你程序的行为,请尽量不要这样...

Happens Before

在单个 goroutine 中,读取和写入的行为必须像按照程序指定的顺序执行一样。 也就是说,只有当重新排序不会改变语言规范定义的 goroutine 中的行为时,编译器和处理器才可以重新排序在单个 goroutine 中执行的读取和写入。 由于这种重新排序,一个 goroutine 观察到的执行顺序可能与另一个 goroutine 感知的顺序不同。 例如,如果一个 goroutine 执行 a = 1; b = 2;,另一个可能会在 a 的更新值之前观察到 b 的更新值。

为了满足读写的需求,我们定义了happens before,Go程序中内存操作的局部顺序。如果事件e1e2之前发生,我们说e2e1之后发生。还有,如果e1不在e2之前发生、e2也不在e1之前发生,那么我们说e1e2并发happen。

在单个goroutine中,happens-before顺序由程序指定。

当下面两个条件满足时,变量v的阅读操作r可能观察到写入操作w

  • r不在w之前发生
  • 没有其他的请求w2发生在w之后,r之前

为了保证r一定能阅读到v,保证wr能观测到的唯一的写操作。当下面两个条件满足时,r保证可以读取到w

  • wr之前发生
  • 任何其他对共享变量v的操作,要么在w之前发生,要么在r之后发生

这一对条件比上一对条件更强;这要求无论是w还是r,都没有相应的并发操作。

在单个goroutine中,没有并发。所以这两个定义等价:读操作r能读到最近一次w写入v的值。但是当多个goroutine访问共享变量时,它们必须使用同步事件来建立happens-before关系。

使用变量v类型的0值初始化变量v的行为类似于内存模型中的写入。

对于大于单个机器字长的值的读取和写入表现为未指定顺序的对多个机器字长的操作。

同步

初始化

程序初始化在单个 goroutine 中运行,但该 goroutine 可能会创建其他并发运行的 goroutine。

如果包 p 导入包 q,则 q 的 init 函数的完成发生在任何 p 的操作开始之前。

main.main 函数的启动发生在所有 init 函数完成之后。

Go协程的创建

go语句启动新的协程发生在新协程启动开始之前。

举个例子

var a string

func f() {
    print(a)
}

func hello() {
    a = "hello, world"
    go f()
}

调用hello将会打印hello, world。当然,这个时候hello可能已经返回了。

Go协程的销毁

go协程的退出并不保证发生在任何事件之前

var a string

func hello() {
    go func() { a = "hello" }()
    print(a)
}

对 a 的赋值之后没有任何同步事件,因此不能保证任何其他 goroutine 都会观察到它。 事实上,激进的编译器可能会删除整个 go 语句。

如果一个 goroutine 的效果必须被另一个 goroutine 观察到,请使用同步机制,例如锁或通道通信来建立相对顺序。

通道通信

通道通信是在go协程之间传输数据的主要手段。在特定通道上的发送总有一个对应的channel的接收,通常是在另外一个协程。

channel上的发送发生在对应channel接收之前

var c = make(chan int, 10)
var a string

func f() {
    a = "hello, world"
    c <- 0
}

func main() {
    go f()
    <-c
    print(a)
}

程序能保证输出hello, world。对a的写入发生在往c发送数据之前,往c发送数据又发生在从c接收数据之前,它又发生在print之前。

channel的关闭发生在从channel中获取到0值之前

在之前的例子中,将c<-0替换为close(c),程序还是能保证输出hello, world

无bufferchannel的接收发生在发送操作完成之前
这个程序,和之前一样,但是调换发送和接收操作,并且使用无buffer的channel

var c = make(chan int)
var a string

func f() {
    a = "hello, world"
    <-c
}

func main() {
    go f()
    c <- 0
    print(a)
}

也保证能够输出hello, world。对a的写入发生在c的接收之前,继而发生在c的写入操作完成之前,继而发生在print之前。

如果该channel是bufferchannel(例如:c=make(chan int, 1)),那么程序就不能保证输出hello, world。可能会打印空字符串、崩溃等等。从而,我们得到一个相对通用的推论:

对于容量为C的buffer channel来说,第k次从channel中接收,发生在第k + C次发送完成之前。

此规则将先前的规则推广到缓冲通道。 它允许通过buffer channel 来模拟信号量:通道中的条数对应活跃的数量,通道的容量对应于最大并发数。向channel发送数据相当于获取信号量,从channel中接收数据相当于释放信号量。 这是限制并发的常用习惯用法。

该程序为工作列表中的每个条目启动一个 goroutine,但是 goroutine 使用limitchannel进行协调,以确保一次最多三个work函数正在运行。

var limit = make(chan int, 3)

func main() {
    for _, w := range work {
        go func(w func()) {
            limit <- 1
            w()
            <-limit
        }(w)
    }
    select{}
}

sync包中实现了两种锁类型:sync.Mutexsync.RWMutex

对于任何的sync.Mutex或者sync.RWMutex变量,且有n<m,第n个调用UnLock一定发生在mLock`之前。

var l sync.Mutex
var a string

func f() {
    a = "hello, world"
    l.Unlock()
}

func main() {
    l.Lock()
    go f()
    l.Lock()
    print(a)
}

这个程序也保证输出hello,world。第一次调用unLock一定发生在第二次Lock调用之前

对于任何sync.RWMutexRLock方法调用,存在变量n,满足RLock方法发生在第nUnLock调用之后,并且对应的RUnlock发生在第n+1Lock方法之前。

Once

在存在多个 goroutine 时,sync包通过once提供了一种安全的初始化机制。对于特定的f,多个线程可以执行once.Do(f),但是只有一个会运行f(),另一个调用会阻塞,直到f()返回

从 once.Do(f) 对 f() 的单个调用返回在任何一个 once.Do(f) 返回之前。

var a string
var once sync.Once

func setup() {
    a = "hello, world"
}

func doprint() {
    once.Do(setup)
    print(a)
}

func twoprint() {
    go doprint()
    go doprint()
}

调用 twoprint 将只调用一次 setup。 setup函数将在任一打印调用之前完成。 结果将是hello, world打印两次。

不正确的同步

注意,读取r有可能观察到了由写入w并发写入的值。尽管观察到了这个值,也并不意味着r后续的读取可以读取到w之前的写入。

var a, b int

func f() {
    a = 1
    b = 2
}

func g() {
    print(b)
    print(a)
}

func main() {
    go f()
    g()
}

有可能g会接连打印2和0两个值。

双检查锁是为了降低同步造成的开销。举个例子,twoprint方法可能会被误写成

var a string
var done bool

func setup() {
    a = "hello, world"
    done = true
}

func doprint() {
    if !done {
        once.Do(setup)
    }
    print(a)
}

func twoprint() {
    go doprint()
    go doprint()
}

因为没有任何机制保证,协程观察到done为true的同时可以观测到a为hello, world,其中有一个doprint可能会输出空字符。

另外一个例子

var a string
var done bool

func setup() {
    a = "hello, world"
    done = true
}

func main() {
    go setup()
    for !done {
    }
    print(a)
}

和以前一样,不能保证在 main 中,观察对 done 的写入意味着观察对 a 的写入,因此该程序也可以打印一个空字符串。 更糟糕的情况下,由于两个线程之间没有同步事件,因此无法保证 main 会观察到对 done 的写入。 main 中的循环会一直死循环。

下面是该例子的一个更微妙的变体

type T struct {
    msg string
}

var g *T

func setup() {
    t := new(T)
    t.msg = "hello, world"
    g = t
}

func main() {
    go setup()
    for g == nil {
    }
    print(g.msg)
}

尽管main观测到g不为nil,但是也没有任何机制保证可以读取到t.msg。

在上述例子中,解决方案都是相同的:请使用显式的同步机制。


有疑问加站长微信联系(非本文作者)

本文来自:简书

感谢作者:ShootHzj

查看原文:Go 内存模型 并发可见性

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

736 次点击  ∙  1 赞  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传