“COG”是Cluster of Orthologous Groups of proteins.构成每个COG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或者是paralogs。Orthologs是指来自于不同物种的由垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。Paralogs是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。
我们开发了一套程序名为COGPipeline, 可以调动NCBI blast+将核酸序列和蛋白序列对COG库进行序列相似性比较,提取COG注释,并调用R进行统计绘图。
COG分析结果:示例
![]() |
![]() |
Identity的分布图 | Score的分布图 |