GoJieba Go 分词库 GoJieba

agolangf2015-09-14 16:00:00 • 3502 次点击    
这是一个分享于 2015-09-14 16:00:00 的项目,其中的信息可能已经有所发展或是发生改变。

GoJieba 是 Jieba 分词的 Go 语言版本分词库。

用法

go get github.com/yanyiwu/gojieba

示例代码请见 example/demo.go

cd example
go run demo.go

之所以需要先 cd 到 example 目录下,是因为 demo.go 里面有写死的字典相对路径。

输出结果:

全模式: 我/来到/北京/清华/清华大学/华大/大学
精确模式: 我/来到/北京/清华大学
新词识别: 他/来到/了/网易/杭研/大厦
搜索引擎模式: 小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造

性能测试

性能不错,因为 GoJieba 本身就是封装了 C++ 版本的 CppJieba 而成, 对比测试了一下,耗时大概是CppJieba 的 1.2 倍。 鉴于 CppJieba 性能还不错(详见jieba-performance-comparison), 所以 GoJieba性能还是可以的, 对于讲究性能的地方还是可以试试的。

客服

i@yanyiwu.com

"结巴"中文分词的Golang版本Read More

Latest commit to the master branch on 3-8-2025
Download as zip
授权协议:
MIT
开发语言:
Google Go 查看源码»
操作系统:
跨平台
3502 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传