blast2GO是用序列相似性得到go的信息,而网上很多软件要么针对某个蛋白的,要么就是只能网上运行的,还有就是只有windows的,烦- -
但如果用名字对应会怎么样,尝试了一番记录如下:
我们的序列先进行blast Nr库得到的是比对的蛋白序列,名字有gi号和refseq号;
NCBI FTP里面有个gene2go的文件,发现是geneid对应go号;
又从FTP里面发现了gene2refseq文件,是geneid对应gi号;
好了,由此我们可以把这三者进行了串联,结果发现了350多条对应关系,而blast2go的结果有303,\(^o^)/~!
但是我将两者取了交集之后,发现只有5个!只有5个!只有5个!!!瞬间伐开心。。。
所以我在想是不是有几种情况要考虑:
首先是过滤,我们blast的参数都是设定好的,当然可以过滤一部分,程序里面取的是在数据库里面有的且最好的,但blast2go肯定做了另一种过滤;
其次是数据库,blast2go可能取了不仅仅是NCBI里面的gene2go,还有其他的,还没搞明白;
最后是程序,是不是blast2go用了层次关联排除了一部分,挖出了一部分,我简直是醉了!!!
还有就是2016年了,做个小总结,虽然有几个月没更新(心烦的事情),但最终暂时解决了,明年会怎样?
有疑问加站长微信联系(非本文作者)