高通量测序技术(High-throughput sequencing)又称“下一代”测序技术("Next-generation" sequencing technology),以能一次并行对几十万到几百万条DNA分子进行序列测定和一般读长较短等为标志。
1、什么是高通量测序
测序法已经成为一种常规的实验技术,不过最近新一代测序技术的显著优势,比如大规模平行信号(MPSS, Brenner et al。2000)和焦磷酸测序法(也称454测序; Margulies et al。2005, Langaee and ronaghi2005)已经使测序技术发生了彻底的变革,它们可以同时对数百万个短序列读长进行测序。尽管面临着来自生物信息学方面的挑战,但是这些技术为探索更多生态学与进化问题提供了更多的机会,其中包括对生物多样性的分析( Venter etal。2004)。此外,二代测序技术是最不可能由于操作不当、缺失、稀有转录及克隆细菌不稳定的原因而产生错误的。技术进步使得这一方法变得不断可靠( Hamady et al。2008),绝大多数的转录表达(包括那些表达量极少的转录本)都能够被精准地定量( StoloⅦ itzky etal。2005)。随着序列读长的增加,454焦磷酸测序法的使用频率将大增,能进一步增加在非模式物种中鉴定基因的概率( Hudson2008)。由于测序的读长较短,这项技术最初只能用于已测序的模式物种。
2、高通量测序原理
高通量测序技术的诞生可以说是基因组学研究领域一个具有里程碑意义的事件。该技术使得核酸测序的单碱基成本与第一代测序技术相比急剧下降, 以人类基因组测序为例, 上世纪末进行的人类基因组计划花费 30 亿美元解码了人类生命密码, 而第二代测序使得人类基因组测序已进入万(美)元基因组时代。如此低廉的单碱基测序成本使得我们可以实施更多物种的基因组计划从而解密更多生物物种的基因组遗传密码。同时在已完成基因组序列测定的物种中, 对该物种的其他品种进行大规模地全基因组重测序也成为了可能。
3、高通量测序作用
测序技术推进科学研究的发展。随着第二代测序技术的迅猛发展,科学界也开始越来越多地应用第二代测序技术来解决生物学问题。比如在基因组水平上对还没有参考序列的物种进行从头测序(de novo sequencing),获得该物种的参考序列,为后续研究和分子育种奠定基础;对有参考序列的物种,进行全基因组重测序(resequencing),在全基因组水平上扫描并检测突变位点,发现个体差异的分子基础。在转录组水平上进行全转录组测序(whole transcriptome resequencing),从而开展可变剪接、编码序列单核苷酸多态性(cSNP)等研究;或者进行小分子RNA测序(small RNA sequencing),通过分离特定大小的RNA分子进行测序,从而发现新的microRNA分子。在转录组水平上,与染色质免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技术相结合,从而检测出与特定转录因子结合的DNA区域和基因组上的甲基化位点。
据了解,高能量的前世为Sanger法第一代测序技术(双脱氧核苷酸末端终止法):利用一种DNA聚合酶来延伸结合在待定序列模板上的引物,直到掺入一种链终止核苷酸为止。由于存在成本高、速度慢、通量低等不足,逐渐被淘汰。
我们现在一般指的高能量测序,是第二代测序,但是它有3种不同的方法:
第二代测序技术(主要包括Roche 454焦磷酸测序,Illumina Solexa测序和ABI SOLID测序),各自优缺点如下:
Roche 454焦磷酸测序技术——依靠生物发光进行DNA序列分析。
优点:读取序列长(400 bp)、可进行从头测序(de novo sequence);
缺点:无法判断重复碱基个数。
Illumina Solexa测序技术——原理是可逆终止化学反应。
优点:高度自动化系统、读取片段多、适合大量小片段的测序(microRNA、lncRNA等);
缺点:读取序列较短、不适于de novo sequence。
ABI SOLID测序技术——核心是4种荧光标记寡核苷酸的连接反应。
优点:每个碱基读取两次非常高的准确性,特别是对于SNP的检测;系统灵活可以进行样本的pooling、分割测序区域;
缺点:读取长度受连接反应限制。
以上三种测序方法各有优缺点,目前科学研究中普遍运用的是Illumina的测序技术。