GoJieba Go 分词库 GoJieba

agolangf • 3142 次点击    
这是一个分享于 的项目,其中的信息可能已经有所发展或是发生改变。
GoJieba 是 Jieba 分词的 Go 语言版本分词库。 ## 用法 <pre>go get github.com/yanyiwu/gojieba</pre> 示例代码请见 example/demo.go <pre>cd example go run demo.go</pre> 之所以需要先 cd 到 example 目录下,是因为 demo.go 里面有写死的字典相对路径。 输出结果: <pre>全模式: 我/来到/北京/清华/清华大学/华大/大学 精确模式: 我/来到/北京/清华大学 新词识别: 他/来到/了/网易/杭研/大厦 搜索引擎模式: 小明/硕士/毕业/于/中国/中国科学院/科学/科学院/学院/计算所/,/后/在/日本/日本京都大学/京都/京都大学/大学/深造</pre> ## 性能测试 性能不错,因为 [GoJieba](http://github.com/yanyiwu/gojieba) 本身就是封装了 C++ 版本的 [CppJieba](http://github.com/yanyiwu/cppjieba) 而成, 对比测试了一下,耗时大概是[CppJieba](http://github.com/yanyiwu/cppjieba) 的 1.2 倍。 鉴于 [CppJieba](http://github.com/yanyiwu/cppjieba) 性能还不错(详见[jieba-performance-comparison](http://yanyiwu.com/work/2015/06/14/jieba-series-performance-test.html)), 所以 [GoJieba](http://github.com/yanyiwu/gojieba)性能还是可以的, 对于讲究性能的地方还是可以试试的。 ## 客服 <pre>i@yanyiwu.com</pre>
授权协议:
MIT
开发语言:
Google Go 查看源码»
操作系统:
跨平台
3142 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传