摘要:本文对基于线粒体COⅠ基因的DNA条形码技术在昆虫分子鉴定中的应用进行了综述,对DNA条形码的意义、DNA条形码的原理、线粒体COⅠ基因的特点、DNA条形码的操作、DNA条形码技术在昆虫分子鉴定中的应用研究进展、DNA条形码的发展趋势以及有关DNA条形码的争论进行了介绍。 关键词:线粒体COⅠ基因;DNA条形码技术;昆虫分子鉴定 目前对于检疫截获昆虫的鉴定大都采用形态学的方法,传统的昆虫形态学鉴定方法存在一定的缺陷,例如大多数昆虫的形态鉴定是以完整的成虫为研究对象,而昆虫的早期(卵、幼虫和蛹)形态结构与肢体残缺的虫体均很难辩认,鉴定非常困难。 在植物检疫工作中,早期形态的昆虫与肢体残缺的虫体是经常被截获的对象,如何对这部分昆虫进行准确的鉴定是植物检疫工作的难点。 20世纪80年代以来,随着PCR技术的建立与完善,涌现出一系列分子生物学技术,这些新技术在有害生物鉴定方面己经广泛应用,极大地弥补了传统形态学鉴定的缺陷。其中,DNA条形码技术就是此类技术中具有代表性的一种。 1、DNA条形码的意义 条形码技术(Barcodetechniques)最早应用于商品零售业,并在零售业的发展过程中起到了举足轻重作用,它大大节省了交易时间,提高了销售效率。在生物分类学领域,根据对一个统一的目标基因DNA序列的分析来完成物种鉴定的过程被称为DNA条形码编码过程。加拿大生物学家PaulHebert(2003)首先倡导将条形码编码技术应用到比零售业更复杂的生物物种鉴定之中,Schindel和Miller(2005)也在Nature上撰文,阐明了DNA条形码的意义。 鉴于依靠形态学手段进行物种鉴定本身的复杂性和低效性,传统分类学家即使持续不断地工作也很难在几个世纪之内把整个地球上的生物完全鉴定出来,可见物种鉴定是一项很艰巨的任务。常规形态学鉴定方法有以下4个较大的缺陷:(1)表型可塑性(Phenotypicplasticity)和遗传可变性(Geneticvariability)容易导致不正确的鉴定;(2)形态学方法无法鉴定许多群体中普遍存在的隐存分类单元;(3)形态学鉴定受生物性别和发育阶段的限制,因此很多生物无法被鉴定;(4)虽然现代交互式鉴定系统是一个很大的进步,但它要求很高的专业技术,一旦操作不正确就很容易导致错误的鉴定。 形态学鉴定的局限性和不断缩减的分类学家队伍,使分类学的发展面临巨大的挑战,亟需一种快捷方便的物种鉴定方法产生(Hebert等,2003)。而基于分子生物学和英特网的DNA条形码技术似乎能够满足这种要求。 DNA条形码技术一旦被证明是一个行之有效的生物鉴定手段,它将对保护生物学,生物多样性研究的发展起到至关重要的作用。其主要作用包括可以完成物种的区别和鉴定,发现新种和隐存种,重建物种和高级阶元的演化关系。它将完成一些传统形态学鉴定手段无法完成的工作,比如可以鉴定生物的卵和幼体,以及动物或植物的寄生物,还能很快鉴定新种,并有可能解决形态学手段难以攻克的隐存种问题,或者根据动物肠道包含物或排泄物的分析来解决食物链问题等。此外,DNA条 形码技术本身的发展,要求一系列更快、更好、更廉价技术的产生,这势必会推动相关的分子生物学技术的进步,从而让其他相关的生物科学受益。再者,一旦解决了物种鉴定的问题,必将给系统发育树的构建提供足够可靠的依据,从而推进生物进化历史的研究。 在出入境检验检疫方面,由于目前专业分类鉴定技术人才的缺乏,在检疫过程中截获的外来有害生物的鉴定工作缺乏准确性和时效性。如果DNA条形码技术发展成熟,检疫人员可以应用该技术及时确定货物中夹藏的外来物种的种类,并确定其是否具有危险性,进而采取相应的检疫措施,从而确保国家的安全。 2、DNA条形码的原理 就像商品零售业条形编码一样,每个物种的DNA序列都是唯一的。在DNA序列上,每个位点都有A、T、G、C等4种选择,虽然由于自然选择的原因,某些位点上的碱基是固定的,从而导致可能的编码组合数减少,但这可以通过只考虑蛋白编码基因来解决。在蛋白编码基因里,由于密码子的简并性,其第3位碱基通常都不受自然选择的作用,是自由变化的,因此只要考虑在蛋白编码基因上的一条长度仅为45个碱基序列就可以获得将近10亿种可选择的编码。由于分子生物学技术的发展,在实际研究过程中,已经能较容易获得一段几百个碱基长度的序列,远远超过45个碱基长度。因此,建立在一段长度为几百个碱基的基因序列信息基础上的DNA条形编码,从理论上来讲完全可以包括所有物种。 3、线粒体COⅠ基因的特点 能够用作条形编码的基因,必须具备两个看似矛盾的特征:(1)必须具有相对的保守性,便于用通用引物扩增出;(2)要有足够的变异能够将物种区分。 核内基因变化的速率通常要低于线粒体基因很多倍,太过保守,要解决种一级的鉴定问题有困难。目前核糖体12S和16S基因虽被广泛用做系统发育研究的标志基因,但这些基因中存在大量的插入和缺失现象,从而使序列比对受到障碍,不便操作,而且还容易造成错误的比对。而在线粒体中存在的13个蛋白编码基因却很少存在插入和缺失,在这13个候选基因中,综合基因序列的长度和进化速率这两个条件,Hebert(2003)最终选定了线粒体细胞色素C氧化酶亚基Ⅰ基因(CytochromecoxidaseI,COI)中一段约645个碱基长度的片段作为条形编码基因。 Hebert选定线粒体COⅠ基因作为条形编码基因是因为:(1)动物生命中绝大部分阶段都存在明显的COⅠ基因序列;(2)大多数细胞中都有上百个以上的线粒体;但只有一组染色体,因此等量的样品中,线粒体的DNA更容易被放大和使用;(3)与细胞核的DNA相比,线粒体DNA的突变速度是核DNA的10倍,使物种分离更准确;(4)线粒体的遗传方式属于母性遗传(孙乃恩等,1990),COⅠ基因位于细胞线粒体中,只能从母体中遗传,因此基因重组的发生率低;而大部分细胞核的基因是从母体和父体共同遗传下来的,基因重组的发生率较高;(5)COⅠ基因拥有蛋白编码基因所共有的特征,即密码子第3位碱基不受自然选择压力的影响,可以自由变异;(6)COⅠ基因在能够保证足够变异的同时又很容易被通用引物扩增,而且其DNA序列本身很少存在插入和缺失,使序列比对容易操作;(7)Hebert等(2003)对动物界,包括脊椎动物和无脊椎动物共11门13320个物种的COⅠ基因序列的比较分析得出:除腔肠动物Cnidaria外,98%的物种遗传距离的差异在种内为0%~2%,种间平均可达到11.3%。据此,Hebert提出可以用单一的小片段线粒体COⅠ基因来代表物种,作为物种的条形编码,为全球生物编码[2]。 4、DNA条形码的操作 DNA条形码的基本操作过程简单,包括以下几个步骤:(1)样品的采集与处理;(2)提取总DNA;(3)利用通用引物PCR扩增目的片断(位于线粒体轻链1490和重链2198之间);(4)纯化PCR产物、测序以及序列分析。序列分析的思路很简单,只要将所有序列进行两两比较并计算其差异值,然后根据差异值来确定物种之间的关系即可。 5、DNA条形码技术在昆虫分子鉴定中的应用研究进展 Tautz等(2002)首先提出要用DNA序列作为生物分类系统的主要平台,即DNA分类学(DNATaxonomy)。Hebert等(2003)提出利用线粒体细胞色素C氧化酶Ⅰ亚基(mtCOⅠ)这一特定基因的特定区段来做DNA条形编码的基础,并且已确定其在动物鉴定中的作用,同时计划给所有生物物种进行编码。 利用DNA条形码可以进行昆虫的鉴定,发现新种和隐存种。其中,鳞翅目研究得最为广泛:Hebert等(2003)选取COⅠ基因的一段序列对鳞翅目200多个种进行种类鉴定,结果表明该特定片段可以100%成功地鉴定每个个体;此后,Hebert等(2004)通过研究被认为同种的2500多只哥斯达黎加普通蝴蝶(Astraptesfulgerator),发现这些蝴蝶的DNA条形编码很清楚地进入10个不同的组中,表明该复合体至少有10个隐存种,而这些蝴蝶的成虫单靠形态学特征则无法区分,从而证明DNA条形码对于发现隐存分类单元有很大帮助;Brown等(2003)结合形态学和DNA条形编码,发表了巴布亚新几内亚的鳞翅目新种Xenothictisgnetivora;Hajibabaei等(2006)应用DNA条形码技术对多种热带鳞翅目昆虫进行了种类识别。在蜉蝣目方面,Ball和Hebert(2005)应用630bpCOⅠ基因序列对蜉蝣目进行研究,结果显示种内和种间序列平均差异分别为1%和18%,证明了DNA条形码可以有效地区分蜉蝣目昆虫。在鞘翅目方面,Monaghan等(2005)在对马达加斯加热带水生甲虫研究中,应用DNA序列在鉴定已记述种的同时发现了几个隐存种。在蚜虫方面,Favret和Voegtlin(2004)用小片段COⅠ基因序列鉴定形态学上难以鉴别的五节根蚜族(Fordini)蚜虫的次生寄主型,结果显示这些型能被准确地鉴定出来。另外,DNA条形码技术在等翅目、弹尾目等诸多昆虫分类中均有应用。 |