如何把Go调用C的性能提升10倍？

LinkerLin · · 2948 次点击 · · 开始浏览

这是一个创建于的文章，其中的信息可能已经有所发展或是发生改变。

第一次，站长亲自招 Gopher 了>>>

目前，当Go需要和C/C++代码集成的时候，大家最先想到的肯定是CGO。毕竟是官方的解决方案，而且简单。

但是CGO是非常慢的。因为CGO其实一个桥接器，通过自动生成代码，CGO在保留了C/C++运行时的情况下，搭建了一个桥来沟通C/C++世界和Go的世界。这就意味着，兼容性很好，但是对C的函数的调用，必须先把当前的goroutine挂起，并切换执行栈到当前的线程M的主栈（大小2MB）。如果不做这个操作，那么只能在goroutine的栈上执行C函数调用，可是，goroutine的栈一般都很小，很容易就导致了栈溢出了。

调用C函数的时候，必须切换当前的栈为线程的主栈，这带来了两个比较严重的问题：

线程的栈在Go运行时是比较少的，受到P/M数量的限制，一般可以简单的理解成受到GOMAXPROCS限制；
由于需要同时保留C/C++的运行时，CGO需要在两个运行时和两个ABI（抽象二进制接口）之间做翻译和协调。这就带来了很大的开销。

minio项目的一个副产品是 c2goasm 项目，这个项目也被 go-cv-simd 项目使用获得了很好的效果。

c2goasm 的角色是一个汇编语言转换器，输入是 clang输出的amd64汇编，输出是go汇编。而clang的输入是C/C++语言。限制是不能有RTTI和异常。也就是说不能有C/C++运行时提供的高级功能。

c2goasm输出的go汇编，交给go的工具链可以直接生成go的可执行代码。

c2goasm和CGO比，最大的改进就是：

不再有C/C++运行时，也就没了在两者之间不停转换的逻辑开销；
不需要切换到线程的主栈来执行函数，因为c2goasm生成的是纯正的go函数，不需要线程的主栈就可以执行；

由此就极大的改进了性能，代价是兼容性和可移植性损失了。

有疑问加站长微信联系（非本文作者）

本文来自：开源中国博客

感谢作者：LinkerLin

查看原文：如何把Go调用C的性能提升10倍？

入群交流（和以上内容无关）：加入Go大咖交流群，或添加微信：liuxiaoyan-s 备注：入群；或加QQ群：692541889

2948 次点击

加入收藏微博

赞

收入我的专栏

上一篇：用Golang处理每分钟百万级请求

下一篇：Go包管理的前世今生

线程

函数

goroutine

代码

3 回复 | 直到 2018-07-03 13:16:42

添加一条新回复（您需要登录后才能回复没有账号？）

请尽量让自己的回复能够对别人有帮助
支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
支持 @ 本站用户；支持表情（输入 : 提示），见 Emoji cheat sheet
图片支持拖拽、截图粘贴等方式上传

关注我

扫码关注领全套学习资料
加入 QQ 群：
- 192706294（已满）
- 731990104（已满）
- 798786647（已满）
- 729884609（已满）
- 977810755（已满）
- 815126783（已满）
- 812540095（已满）
- 1006366459（已满）
- 692541889
加入微信群：liuxiaoyan-s，备注入群
也欢迎加入知识星球 Go粉丝们（免费）

X

登录和大家一起探讨吧