COG(Cluster of Orthologous Groups of proteins 蛋白相邻类的聚簇)是对蛋白质进行直系同源分类的数据库。构成每个COG的蛋白都是被假定为来自于一个祖先蛋白,并且因此或者是orthologs或者是paralogs。Orthologs是指来自于不同物种的由垂直家系(物种形成)进化而来的蛋白,并且典型的保留与原始蛋白有相同的功能。Paralogs是那些在一定物种中的来源于基因复制的蛋白,可能会进化出新的与原来有关的功能。我们将鉴定到的和COG数据库进行比对,预测这些蛋白可能的功能并对其做功能分类统计。