在 DNA 测序方面,当今可用的三种主要技术可提供出色的结果——尤其是在您明智地选择的情况下。这些方法——Sanger 测序、下一代测序 (NGS) 和长读长测序——有很大的不同,新手测序人员应该了解哪种方法最适合他们的研究。以下是对这些方法、优缺点和重要标准的简要回顾,可帮助您权衡下一个测序选择。
选择测序方法的标准
选择测序方法的标准很多,取决于研究人员及其项目的性质。正在研究的生物学问题是关键。Pacific Biosciences 副总裁兼首席科学官 Jonas Korlach 说:“研究的背景决定了最好使用哪种类型的测序,因为不同的测序方法具有不同的特征来推动选择。”
最常见的标准包括测序时间、通量、成本和准确性——所有这些往往会相互影响。“准确性、成本和数据吞吐量之间的动态一直是测序技术选择的驱动因素,”Illumina 首席技术官兼研究和产品开发主管 Alex Aravanis 说。“在不牺牲准确性的情况下,成本和通量的提高推动了 DNA 测序对广泛的应用和用户的可及性。”
成本将取决于是否需要购买仪器,或者您是否已经可以使用(在实验室、部门或核心设施中);购买材料和试剂;样本数量;以及您是否计划外包任何测序或准备步骤。另一个值得考虑的因素是要测序的目标的大小(即,整个基因组,或只有几个基因),因为这会影响测序时间和成本。
作为一个考虑因素,排序时间包括项目完成的预期总时间,还包括动手时间与自动化时间。此外,考虑测序技术的吞吐量水平,它会影响项目的预期总时间。
测序过程中产生的读取长度也可能会影响决策,因为某些应用需要更长的读取长度(见下文)。NGS 产生最短的读长(约 50-500 bp),其次是 Sanger 测序(约 500-1000 bp),然后是长读长测序(约 5-30 kb)。“阅读长度是一个考虑因素,即客户将测序到回答生物学问题所需的长度,但不是更长,因为它会增加成本和时间,”Aravanis 说。
桑格测序
Sanger 测序是一项久经考验的技术,对于少量样本来说简单快速,能够解析单个碱基对。它在掺入放射性标记的核苷酸类似物后通过链终止起作用。然后通过琼脂糖凝胶电泳分离得到的 DNA 片段以进行鉴定。Sanger 方法有助于包含重复和二级结构的复杂 DNA 区域,并且通常作为正交方法来验证 NGS 检测到的遗传变异。
但是,与 NGS 相比,Sanger 测序的通量较低,因此可能不适合大型项目。“Sanger 测序可对较小的 DNA 区域、一小组基因和通常少于 1000 个样本进行高度准确的测序,”赛默飞世尔科技 NGS 精准医学计划全球负责人 Jeffrey Smith 说。
事实上,对于较小范围的项目,使用 Sanger 排序通常是最有意义的。“使用 Sanger 测序进行靶向或聚焦测序的项目时间、成本和复杂性要低得多,”赛默飞世尔科技毛细管电泳副总裁兼总经理 Kay Eron 说。毛细管电泳在毛细管电泳仪器上的毛细管内使用 Sanger 测序化学,有助于查明基因片段中的单个碱基。
新一代测序
遗传目标的大小将强烈影响测序方法的选择。“虽然较小的 DNA 大小和少量基因更适合 Sanger 测序,但大面积的基因组或基因组和基因靶标最适合 NGS,”Eron 说。NGS 也称为大规模并行测序,采用合成测序方法,在大规模并行方法中使用荧光标记的核苷酸。
与使用 Sanger 测序相比,NGS 的更高通量使大型项目更快、更容易、更便宜。“在对基因组或基因组等大区域进行测序时,NGS 的项目时间和成本会更低,”Eron 说。NGS 是全基因组测序、全外显子组测序、分析大型基因组、检测罕见变异以及发现和诊断的理想选择。“使用 NGS 技术可以有效地完成扫描基因组大面积区域以检测新突变或同时对一组基因进行测序的发现研究,”史密斯说。“Sanger 测序 [用于这些应用] 只会花费太长的时间,而且在美元和组织方面的成本都太高了。” NGS 所需的样本输入量较少,也使其成为分析稀有样本的理想选择。
NGS 的多学科实用性和可扩展性可能是一些研究人员的决策点。“NGS 在基因组学、转录组学和表观遗传学方面具有极其广泛的适用性,能够从基于小扩增子的实验扩展到群体规模的全基因组测序项目,”Aravanis 说。然而,对于靶向测序(例如,一个或多个基因),NGS 可能比 Sanger 更昂贵。NGS 还需要使用更昂贵的 NGS 测序仪仪器。NGS 工作流程比 Sanger 测序更复杂,但越来越多地使用自动化正在减轻这种负担。
长读测序
在长读长测序中,DNA 片段在穿过纳米孔时单独测序(Oxford Nanopore Technologies),或者在单个小孔中复制(Pacific Biosciences)。更长的重叠序列使组装更容易,就像用更少、更大的块拼凑一个拼图游戏,而不是 NGS 中更多的小块。其他优点包括消除了扩增偏差,并且可以更容易地检测到大插入/缺失、重复区域等特征。长读长测序的错误率可能高于 NGS,但持续的技术改进正在缩小准确性差距。
如果较短的测序读数不足以回答您的生物学问题,长读数测序是一个不错的选择。“提供长读长(1 kb 或更长)的测序技术有助于基因组组装和检测稀有变异,”Smith 说。“由于需要更完整的基因组覆盖和更好地了解整个染色体组织,这些应用程序适合这种方法。”
Pacific Biosciences 的 HiFi 测序使用其 SMRT 技术,确保需要全面了解人类基因组的基因组研究的高读取准确性。“这揭示了更多的基因组区域,提供了重要的相位信息,并提供了全长 RNA 转录本分辨率,所有这些都是短读长测序无法获得的,”Korlach 说。“例如,在罕见病和遗传病研究领域,研究人员使用 PacBio HiFi 测序来解决短读长不足且无法提供答案的情况。” PacBio 正在与加州大学洛杉矶分校精准医学研究所和大卫格芬医学院以及拉迪儿童基因组医学研究所合作,以帮助识别罕见的疾病变异。
有时研究人员可能需要使用两种测序方法。“一小部分人类基因组特别难以阅读,”Aravanis 说。“纳米孔和单分子 [长读长测序] 方法可以作为 Illumina SBS [NGS] 的补充方式,作为反射测试或正交验证,或与 Illumina SBS 和其他从头组装和/或参考基因组。” 虽然这很不寻常,但很高兴知道存在这种可能性,并且技术的进步使所有方法变得越来越方便和负担得起。