bayesian Golang 的 Naive Bayesian 类别 bayesian

xuanbao • 673 次点击    
这是一个分享于 的项目,其中的信息可能已经有所发展或是发生改变。
支持 TF-IDF 的 Naive Bayesian 分类。 特点: * 条件概率和“对数似然”分值。 * 下溢检测。 * 分类器简单持久。 * 统计。 ### 举例1 (plain no tf-idf) 使用分类器,先创建一个分类并测试: <pre box-sizing:="" font-family:="" liberation="" font-size:="" margin-top:="" margin-bottom:="" font-stretch:="" line-height:="" word-wrap:="" padding:="" overflow:="" background-color:="" border-radius:="" word-break:="">import . &#34;bayesian&#34;const (    Good Class = &#34;Good&#34;     Bad Class = &#34;Bad&#34;)classifier := NewClassifier(Good, Bad)goodStuff := []string{&#34;tall&#34;, &#34;rich&#34;, &#34;handsome&#34;}badStuff  := []string{&#34;poor&#34;, &#34;smelly&#34;, &#34;ugly&#34;} classifier.Learn(goodStuff, Good) classifier.Learn(badStuff,  Bad)</pre> 然后你可以 查明每个类的分值类的 数据所属 : <pre box-sizing:="" font-family:="" liberation="" font-size:="" margin-top:="" margin-bottom:="" font-stretch:="" line-height:="" word-wrap:="" padding:="" overflow:="" background-color:="" border-radius:="" word-break:="">scores, likely, _ := classifier.LogScores(                         []string{&#34;tall&#34;, &#34;girl&#34;}                      )</pre> 分数 的大小 表示似然性。另外(但浮溢的一些风险),但可以 得到 实际的 概率 : <pre box-sizing:="" font-family:="" liberation="" font-size:="" margin-top:="" margin-bottom:="" font-stretch:="" line-height:="" word-wrap:="" padding:="" overflow:="" background-color:="" border-radius:="" word-break:="">probs, likely, _ := classifier.ProbScores(                         []string{&#34;tall&#34;, &#34;girl&#34;}                      )</pre> ### [ ](https://github.com/jbrukh/bayesian#example-2-tf-idf)举例2 (TF-IDF) 在分类 方法 (LogScore, ProbSafeScore , ProbScore )之 前, 要使用 TF-IDF分类,首先必须创建一些类和测试它,之后你需要调用ConvertTermsFreqToTfIdf()  。 <pre box-sizing:="" font-family:="" liberation="" font-size:="" margin-top:="" margin-bottom:="" font-stretch:="" line-height:="" word-wrap:="" padding:="" overflow:="" background-color:="" border-radius:="" word-break:="">import . &#34;bayesian&#34;const (    Good Class = &#34;Good&#34;     Bad Class = &#34;Bad&#34;)classifier := NewClassiferTfIdf(Good, Bad) // Extra constructorgoodStuff := []string{&#34;tall&#34;, &#34;rich&#34;, &#34;handsome&#34;}badStuff  := []string{&#34;poor&#34;, &#34;smelly&#34;, &#34;ugly&#34;} classifier.Learn(goodStuff, Good) classifier.Learn(badStuff,  Bad) classifier.ConvertTermsFreqToTfIdf() // IMPORTANT !!</pre>     然后你可以查明每个类的分值和类的 数据所属  : <pre box-sizing:="" font-family:="" liberation="" font-size:="" margin-top:="" margin-bottom:="" font-stretch:="" line-height:="" word-wrap:="" padding:="" overflow:="" background-color:="" border-radius:="" word-break:="">scores, likely, _ := classifier.LogScores(                         []string{&#34;tall&#34;, &#34;girl&#34;}                      )</pre> 分数 的大小 表示似然性。另外(但浮溢的一些风险),但可以 得到 实际的 概率 : <pre box-sizing:="" font-family:="" liberation="" font-size:="" margin-top:="" margin-bottom:="" font-stretch:="" line-height:="" word-wrap:="" padding:="" overflow:="" background-color:="" border-radius:="" word-break:="">probs, likely, _ := classifier.ProbScores(                         []string{&#34;tall&#34;, &#34;girl&#34;}                      )</pre>
授权协议:
BSD
开发语言:
Google Go 查看源码»
操作系统:
跨平台
673 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传