基因识别

来自计算思维百科
跳转至: 导航搜索

基因识别,是生物信息学的一个重要分支,使用生物学实验或计算机等手段识别DNA序列上的具有生物学特征的片段。基因识别的对象主要是蛋白质编码基因,也包括其他具有一定生物学功能的因子,如RNA基因和调控因子。基因识别是基因组研究的基础。基因识别的主要手段是基于活的细胞或生物的实验。通过对若干种不同基因的同源重组的速率的统计分析,我们能够获知它们在染色体上的顺序。若进行大量类似的分析,我们可以确定各个基因的大致位置。现在,由于人类已经获得了巨大数量的基因组信息,依靠较慢的实验分析已不能满足基因识别的需要,而基于计算机算法的基因识别得到了长足的发展,成为了基因识别的主要手段。

识别具有生物学功能的片段与判定该片段(或其对应的产品)的功能是两个不同的概念,后者通常需要通过基因敲除等的实验手段来决定。不过,生物信息学的前沿研究正在使得由基因序列预测基因功能变得愈发可能。

人类长达30个亿DNA序列中只有3%-5%是基因。阐明人体中全部基因的位置,结构,功能,表达等,计算能力扮演了一个重要的角色,一个重要应用就是模拟基因表达数据集。