另一种blast2go的思路

skenoy · · 10278 次点击 · · 开始浏览    
这是一个创建于 的文章,其中的信息可能已经有所发展或是发生改变。

blast2GO是用序列相似性得到go的信息,而网上很多软件要么针对某个蛋白的,要么就是只能网上运行的,还有就是只有windows的,烦- -

但如果用名字对应会怎么样,尝试了一番记录如下:

我们的序列先进行blast Nr库得到的是比对的蛋白序列,名字有gi号和refseq号;

NCBI FTP里面有个gene2go的文件,发现是geneid对应go号;

又从FTP里面发现了gene2refseq文件,是geneid对应gi号;

好了,由此我们可以把这三者进行了串联,结果发现了350多条对应关系,而blast2go的结果有303,\(^o^)/~!

但是我将两者取了交集之后,发现只有5个!只有5个!只有5个!!!瞬间伐开心。。。


所以我在想是不是有几种情况要考虑:

首先是过滤,我们blast的参数都是设定好的,当然可以过滤一部分,程序里面取的是在数据库里面有的且最好的,但blast2go肯定做了另一种过滤;

其次是数据库,blast2go可能取了不仅仅是NCBI里面的gene2go,还有其他的,还没搞明白;

最后是程序,是不是blast2go用了层次关联排除了一部分,挖出了一部分,我简直是醉了!!!


还有就是2016年了,做个小总结,虽然有几个月没更新(心烦的事情),但最终暂时解决了,明年会怎样?


有疑问加站长微信联系(非本文作者)

本文来自:CSDN博客

感谢作者:skenoy

查看原文:另一种blast2go的思路

入群交流(和以上内容无关):加入Go大咖交流群,或添加微信:liuxiaoyan-s 备注:入群;或加QQ群:692541889

10278 次点击  
加入收藏 微博
暂无回复
添加一条新回复 (您需要 登录 后才能回复 没有账号 ?)
  • 请尽量让自己的回复能够对别人有帮助
  • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`
  • 支持 @ 本站用户;支持表情(输入 : 提示),见 Emoji cheat sheet
  • 图片支持拖拽、截图粘贴等方式上传