本文一个简单的golang工作池,仅供交流和学习使用。golang工作池的作用是可以限制goroutine的启动数量。
//NewTask是放到工作池当中运行的函数。使用的时候需要先实例化他
w := pool.NewTask(func() error { fmt.Println(time.Now());return nil })
//实例化工作池
p := pool.NewPool(3)
//这里启用另外一个goroutine向worker当中写入,不然会出现all goroutines are asleep,需要从管道中获得一个数据,而这个数据必须是其他goroutine线放入管道的
go func() {
for {
p.Worker <- w //把需要运行的函数依次放入工作池。
}
}()
p.Run()
为什么需要工作池?
一般情况下,goroutine在操作系统上只要你的硬件资源够它是可以无限启动的。但是如果出现大规模的启动goroutine的情况会造成大量占用系统资源,我们知道普通的部署一个golang应用的时候操作系统不仅仅会运行golang程序还有其他辅助的程序运行,所以理论上讲工作池的目的就是为了限制golang的启动数量,保证不会出现硬件计算资源溢出的情况。
实际我们真的需要工作池吗?
理论上来讲,我们其实不需要在golang层面设置工作池的。如果是网络请求大部分时候我们会使用nginx或者其他网关,中间件作为golang程序的代理,我们可以在请求访问流量进入到golang程序之前使用nginx或者其他中间件限制流量或者使用熔断机制来保证我们的golang程序不会开满goroutine造成硬件计算资源溢出的情况。 如果流量小完全没必要限制goroutine 如果流量大没有熔断机制对整个服务都是很危险的。
工作池性能的讨论
我在编写自己的工作池之前使用了很多其他的工作池,我发现工作池本身并不会提升执行效率,反而会拖慢效率,使用工作池程序执行时间大概是原来的2/3,但是有一些pool会在一定程度上节省内存,比如ants,但内存的节省我觉得更多的是在于数据结构的复用,没有大量的重复创建数据对象导致的内存节省。
goroutine是否需要像其他编程语言一样使用I/O多路复用?
根据我在网上可以搜索到的资料,以及我自己的理解,golang本身是有一个pool用来复用goroutine的,所以我们并不需要自己再去实现一个多路复用的功能,反而会拖慢程序。
其他
以上论调并没有严谨的验证过,只是个人遇到的情况分享,希望和大家共同讨论学习,共同进步。
工作池代码如下
package pool
import "sync"
//创建worker,每一个worker抽象成一个可以执行任务的函数
type Worker struct {
f func() error
}
//通过NewTask来创建一个worker
func NewTask(f func() error) *Worker {
return &Worker{
f:f,
}
}
//执行worker
func (t *Worker) Run(wg *sync.WaitGroup) {
t.f()
//减少waitGroup计数器的值
wg.Done()
}
//池
type Pool struct {
//这个*Worker指针切片用来接受任务,方便外部调用,减少channel异常的问题,这里会整个切片一起提交
//Workers []*Worker
//这里的Worker是一个管道,用来接受其他go程带来的数据,实时执行,无限等待数据循环,这里使用另外一个管道还可以隐藏wg的操作。让外部程序使用更方便一些。
Worker chan *Worker
//size用来表明池的大小,不能超发。
size int
//jobs表示执行任务的通道用于作为队列,我们将任务从切片当中取出来,然后存放到通道当中,再从通道当中取出任务并执行。
Jobs chan *Worker
//用于阻塞
wg sync.WaitGroup
}
//实例化工作池使用
func NewPool(cap int) *Pool {
return &Pool{
//Workers:tasks,
Worker:make(chan *Worker),
size: cap,
Jobs:make(chan *Worker),
}
}
//从jobs当中取出任务并执行。
func (p *Pool) work() {
for task := range p.Jobs{
task.Run(&p.wg)
}
}
//执行工作池当中的任务
func (p *Pool) Run(){
//只启动有限大小的协程,协程的数量不可以超过工作池设定的数量,防止计算资源崩溃
for i:=0;i<p.size;i++{
go p.work()
}
//从worker切片当中把任务取出
for task := range p.Worker{
p.wg.Add(1)
p.Jobs <- task
}
//执行完毕就需要关闭jobs
close(p.Jobs)
//执行的过程需要阻塞直到有空闲的goroutine可用
p.wg.Wait()
}
有疑问加站长微信联系(非本文作者)