>你必须非常努力,才能看起来毫不费力!
>
>微信搜索公众号[ 漫漫Coding路 ],一起From Zero To Hero !
## 前言
前面两篇文章 [初见 Go Mutex](https://mp.weixin.qq.com/s?__biz=MzU5NzU2NDk2MA==&mid=2247485162&idx=1&sn=3378b61c4fcf9f17d4c27ede6252dd60&chksm=fe50cda5c92744b3c7ac38b17f8aa738055cd4424216101aa595110d5a916bf4bc9b3db52ce3#rd)、 [Go Mutex 源码详解](https://mp.weixin.qq.com/s?__biz=MzU5NzU2NDk2MA==&mid=2247485176&idx=1&sn=31ca207428c1c8170f714c3771759279&chksm=fe50cdb7c92744a107aaa6eff17e7e62fff3318adfb664234ae2dc6254f3eb57b6c6b491b8d4#rd) ,我们学习了 `Go语言` 中的 `Mutex`,它是一把互斥锁,每次只允许一个 `goroutine` 进入临界区,这种可以保证临界区资源的状态正确性。但是有的情况下,并不是所有 `goroutine` 都会修改临界区状态,可能只是读取临界区的数据,如果此时还是需要每个 `goroutine` 拿到锁依次进入的话,效率就有些低下了。例如房间里面有一幅画,有人想修改,有人只是想看一下,完全可以放要看的一部分人进去,等他们看完再让修改的人进去修改,这样既提高了效率,也保证了临界区资源的安全。看和修改,对应的就是读和写,本篇文章我们就一起来学习下 `Go语言` 中的读写锁 `sync.RWMutex`。
> 说明:本文中的示例,均是基于Go1.17 64位机器
>
> 提示:公众号设置星标,及时获取更新;文末博客内阅读,阅读体验更加
## RWMutex 总览
`RWMutex` 是一个`读/写互斥锁`,在某一时刻只能由`任意数量`的 `reader` 持有 或者 `一个 writer` 持有。也就是说,要么放行任意数量的 reader,多个 reader 可以`并行读`;要么放行一个 writer,多个 writer 需要`串行写`。
RWMutex 对外暴露的方法有五个:
- RLock():读操作获取锁,如果锁已经被 `writer` 占用,会一直阻塞直到 `writer` 释放锁;否则直接获得锁;
- RUnlock():读操作完毕之后释放锁;
- Lock():写操作获取锁,如果锁已经被 `reader` 或者 `writer` 占用,会一直阻塞直到获取到锁;否则直接获得锁;
- Unlock():写操作完毕之后释放锁;
- RLocker():返回读操作的 `Locker` 对象,该对象的 `Lock()` 方法对应 `RWMutex` 的 `RLock()`,`Unlock()` 方法对应 `RWMutex` 的 `RUnlock()` 方法。
一旦涉及到多个 reader 和 writer ,就需要考虑优先级问题,是 reader 优先还是 writer 优先:
- reader优先:只要有 reader 要进行读操作,writer 就一直等待,直到没有 reader 到来。这种方式做到了读操作的并发,但是如果 reader 持续到来,会导致 writer 饥饿,一直不能进行写操作;
- writer优先:只要有 writer 要进行写操作,reader 就一直等待,直到没有 writer 到来。这种方式提高了写操作的优先级,但是如果 writer 持续到来,会导致 reader 饥饿,一直不能进行读操作;
- 没有优先级:按照先来先到的顺序,没有谁比谁更优先,这种相对来说会更公平。
我们先来看下 RWMutex 的运行机制,就可以知道它的优先级是什么了。
可以想象 RWMutex 有两个队伍,一个是包含 `所有reader` 和你`获得准入权writer` 的 `队列A`,一个是还没有获得准入权 writer 的 `队列B`。
1. 队列 A 最多只允许有 `一个writer`,如果有其他 writer,需要在 队列B 等待;
2. 当一个 writer 到了 队列A 后,只允许它 `之前的reader` 执行读操作,新来的 reader 需要在 队列A 后面排队;
3. 当前面的 reader 执行完读操作之后,writer 执行写操作;
4. writer 执行完写操作后,让 `后面的reader` 执行读操作,再`唤醒队列B` 的一个 `writer` 到 队列A 后面排队。
**初始时刻** 队列A 中 writer `W1` 前面有三个 reader,后面有两个 reader,队列B中有两个 writer
![RWMutex运行示例:初始时刻](https://tva1.sinaimg.cn/large/e6c9d24ely1h1wefan9hkj21900rsgmi.jpg)
**并发读** 多个 reader 可以同时获取到读锁,进入临界区进行读操作;writer `W1` 在 `队列A` 中等待,同时又来了两个 reader,直接在 `队列A` 后面排队
![RWMutex运行示例:并发读](https://tva1.sinaimg.cn/large/e6c9d24ely1h1we60aatqj21980s8my7.jpg)
**写操作** `W1` 前面所有的 reader 完成后,`W1` 获得锁,进入临界区操作
![RWMutex运行示例:写操作](https://tva1.sinaimg.cn/large/e6c9d24ely1h1we9s0crnj218w0skaaz.jpg)
**获得准入权** `W1` 完成写操作退出,先让后面排队的 reader 进行读操作,然后从 队列B 中唤醒 `W2` 到 `队列A` 排队。`W2` 从 `队列B` 到 `队列A` 的过程中,`R8` 先到了 `队列A`,因此 `R8` 可以执行读操作。`R9`、`R10`、`R11` 在 `W2` 之后到的,所以在后面排队;新来的 `W4` 直接在队列B 排队。
![RWMutex运行示例:获得准入权](https://tva1.sinaimg.cn/large/e6c9d24ely1h1werj4f63j21900s4gmo.jpg)
从上面的示例可以看出,`RWMutex` 可以看作是没有优先级,按照先来先到的顺序去执行,只不过是 `多个reader` 可以 `并行 `去执行罢了。
## 深入源码
### 数据结构
```go
type RWMutex struct {
w Mutex // 控制 writer 在 队列B 排队
writerSem uint32 // 写信号量,用于等待前面的 reader 完成读操作
readerSem uint32 // 读信号量,用于等待前面的 writer 完成写操作
readerCount int32 // reader 的总数量,同时也指示是否有 writer 在队列A 中等待
readerWait int32 // 队列A 中 writer 前面 reader 的数量
}
// 允许最大的 reader 数量
const rwmutexMaxReaders = 1 << 30
```
上述中的几个变量,比较特殊的是 `readerCount` ,不仅表示当前 `所有reader` 的数量,同时表示是否有 `writer` 在队列A中等待。当 `readerCount` 变为 `负数` 时,就代表有 writer 在队列A 中等待了。
- 当有 writer 进入 队列A 后,会将 `readerCount` 变为负数,即 `readerCount = readerCount - rwmutexMaxReaders`,同时利用 `readerWait` 变量记录它前面有多少个 reader;
- 如果有新来的 reader,发现 `readerCount` 是负数,就会直接去后面排队;
- writer 前面的 reader 在释放锁时,会将 `readerCount` 和 `readerWait`都减一,当 readerWait==0 时,表示 writer 前面的所有 reader 都执行完了,可以让 writer 执行写操作了;
- writer 执行写操作完毕后,会将 readerCount 再变回正数,`readerCount = readerCount + rwmutexMaxReaders`。
举例:假设当前有两个 reader,readerCount = 2;允许最大的reader 数量为 10
- 当 writer 进入队列A 时,readerCount = readerCount - rwmutexMaxReaders = -8,readerWait = readerCount = 2
- 如果再来 3 个reader,readerCount = readerCount + 3 = -5
- 获得读锁的两个reader 执行完后,readerCount = readerCount - 2 = -7,readerWait = readerWait-2 =0,writer 获得锁
- writer 执行完后,readerCount = readerCount + rwmutexMaxReaders = 3,当前有 3个 reader
### RLock()
reader 执行读操作之前,需要调用 RLock() 获取锁
```go
func (rw *RWMutex) RLock() {
// reader 加锁,将 readerCount 加一,表示多了个 reader
if atomic.AddInt32(&rw.readerCount, 1) < 0 {
// 如果 readerCount<0,说明有 writer 在自己前面等待,排队等待读信号量
runtime_SemacquireMutex(&rw.readerSem, false, 0)
}
}
```
### RUnlock()
reader 执行完读操作后,调用 RUnlock() 释放锁
```go
func (rw *RWMutex) RUnlock() {
// reader 释放锁,将 readerCount 减一,表示少了个 reader
if r := atomic.AddInt32(&rw.readerCount, -1); r < 0 {
// 如果readerCount<0,说明有 writer 在自己后面等待,看是否要让 writer 运行
rw.rUnlockSlow(r)
}
}
```
```go
func (rw *RWMutex) rUnlockSlow(r int32) {
// 将 readerWait 减一,表示前面的 reader 少了一个
if atomic.AddInt32(&rw.readerWait, -1) == 0 {
// 如果 readerWait 变为了0,那么自己就是最后一个完成的 reader
// 释放写信号量,让 writer 运行
runtime_Semrelease(&rw.writerSem, false, 1)
}
}
```
### Lock()
writer 执行写操作之前,调用 Lock() 获取锁
```go
func (rw *RWMutex) Lock() {
// 利用互斥锁,如果前面有 writer,那么就需要等待互斥锁,即在队列B 中排队等待;如果没有,可以直接进入 队列A 排队
rw.w.Lock()
// atomic.AddInt32(&rw.readerCount, -rwmutexMaxReaders) 将 readerCount 变成了负数
// 再加 rwmutexMaxReaders,相当于 r = readerCount,r 就是 writer 前面的 reader 数量
r := atomic.AddInt32(&rw.readerCount, -rwmutexMaxReaders) + rwmutexMaxReaders
// 如果 r!= 0 ,表示自己前面有 reader,那么令 readerWait = r,要等前面的 reader 运行完
if r != 0 && atomic.AddInt32(&rw.readerWait, r) != 0 {
runtime_SemacquireMutex(&rw.writerSem, false, 0)
}
}
```
`Lock()` 和 `RUnlock()` 是会并发进行的:
1. 如果 Lock() 将 readerCount 变为负数后,假设 r=3,表示加入的那一刻前面有三个 reader,还没有赋值 readerWait CPU 就被强占了,readerWait = 0;
2. 假设此时三个 reader 的 RUnlock() 会进入到 rUnlockSlow() 逻辑,每个 reader 都将 readerWait 减一, readerWait 会变成负数,此时不符合唤醒 writer 的条件;
3. 三个 reader 运行完之后,此时 readerWait = -3, Lock() 运行到 atomic.AddInt32(&rw.readerWait, r) = -3+3 =0,也不会休眠,直接获取到锁,因为前面的 reader 都运行完了。
这就是为什么 `rUnlockSlow()` 要判断 `atomic.AddInt32(&rw.readerWait, -1) == 0` 以及 `Lock()` 要判断 `atomic.AddInt32(&rw.readerWait, r) != 0` 的原因。
### Unlock()
writer 执行写操作之后,调用 Lock() 释放锁
```go
func (rw *RWMutex) Unlock() {
// 将 readerCount 变为正数,表示当前没有 writer 在队列A 等待了
r := atomic.AddInt32(&rw.readerCount, rwmutexMaxReaders)
// 将自己后面等待的 reader 唤醒,可以进行读操作了
for i := 0; i < int(r); i++ {
runtime_Semrelease(&rw.readerSem, false, 0)
}
// 释放互斥锁,如果队列B有writer,相当于唤醒一个来队列A 排队
rw.w.Unlock()
}
```
writer 对 readerCount 一加一减,不会改变整体状态,只是用正负来表示是否有 writer 在等待。当然,如果在 writer 将 readerCount变为负数后,来了很多 reader,将 readerCount 变为了正数,此时reader 在 writer 没有释放锁的时候就获取到锁了,是有问题的。但是 rwmutexMaxReaders 非常大,可以不考虑这个问题。
## 常见问题
1. 不可复制
和 Mutex 一样,RWMutex 也是不可复制。不能复制的原因和互斥锁一样。一旦读写锁被使用,它的字段就会记录它当前的一些状态。这个时候你去复制这把锁,就会把它的状态也给复制过来。但是,原来的锁在释放的时候,并不会修改你复制出来的这个读写锁,这就会导致复制出来的读写锁的状态不对,可能永远无法释放锁。
2. 不可重入
不可重入的原因是,获得锁之后,还没释放锁,又申请锁,这样有可能造成死锁。比如 reader A 获取到了读锁,writer B 等待 reader A 释放锁,reader 还没释放锁又申请了一把锁,但是这把锁申请不成功,他需要等待 writer B。这就形成了一个循环等待的死锁。
3. 加锁和释放锁一定要成对出现,不能忘记释放锁,也不能解锁一个未加锁的锁。
## 实战一下
Go 中的 map 是不支持 并发写的,我们可以利用 读写锁 RWMutex 来实现并发安全的 map。在读多写少的情况下,使用 RWMutex 要比 Mutex 性能高。
```go
package main
import (
"fmt"
"math/rand"
"sync"
"time"
)
type ConcurrentMap struct {
m sync.RWMutex
items map[string]interface{}
}
func (c *ConcurrentMap) Add(key string, value interface{}) {
c.m.Lock()
defer c.m.Unlock()
c.items[key] = value
}
func (c *ConcurrentMap) Remove(key string) {
c.m.Lock()
defer c.m.Unlock()
delete(c.items, key)
}
func (c *ConcurrentMap) Get(key string) interface{} {
c.m.RLock()
defer c.m.RUnlock()
return c.items[key]
}
func NewConcurrentMap() ConcurrentMap {
return ConcurrentMap{
items: make(map[string]interface{}),
}
}
func main() {
m := NewConcurrentMap()
var wait sync.WaitGroup
wait.Add(10000)
for i := 0; i < 10000; i++ {
key := fmt.Sprintf("%d", rand.Intn(10))
value := fmt.Sprintf("%d", rand.Intn(100))
if i%100 == 0 {
go func() {
defer wait.Done()
m.Add(key, value)
}()
} else {
go func() {
defer wait.Done()
fmt.Println(m.Get(key))
time.Sleep(time.Millisecond * 10)
}()
}
}
wait.Wait()
}
```
## 总结
本文以图文并茂的方式介绍了RWMutex的运行机制,对源码进行逐行分析,学习了 RWMutex 底层是如何实现的,同时列举了一些 RWMutex 的常见错误。如果本篇文章对有所帮助,点个关注 + 转发哦 \^_\^
## 更多
个人博客: https://lifelmy.github.io/
微信公众号:漫漫Coding路
有疑问加站长微信联系(非本文作者)