互动社区 · 2026年6月24日

从一代测序到三代测序,我们如何读懂“生命的说明书”?——揭开DNA测序的奥秘

 

我们每个人的生命都有一本体量庞大的“说明书”,它用A、C、T、G四个碱基写下了关于你的一切:你眼睛的颜色、你的血型、甚至是得某种病的概率。这本说明书,就是你的DNA。接下来,我们一起看看这将近五十年的历程中,人类是如何一步步读懂这本生命说明书的:

1977年,一位叫弗雷德·桑格的科学家,在花费了几年时间后,终于读完了第一个完整的基因组——它含有5373个碱基,来自一种叫phiX174的病毒。自此,人类打开了基因测序的大门。

桑格发明的双脱氧链终止法(后文称Sanger测序),是基因测序的开山鼻祖。我们可以把它想象成手工抄书:我们要想抄写一段DNA序列,首先需要准备好这本书的“复印底稿”(DNA序列),四种正常的“文字笔”(A/T/C/G四种碱基),再加入四种特殊的“终止笔”——每一种对应一个碱基,一旦用它写字,这句话就没法再往下写了。

把这些材料混合后,会生成一堆长短不一、结尾各有不同碱基的DNA片段:比如结尾是A的片段、结尾是T的片段……通过凝胶电泳把这些片段按长短分开,最后用仪器读取每个片段末端的标记,就能拼出完整的DNA序列了。

(图1:Sanger测序原理图)

Sanger测序这一方法操作简单,准确率极高,因此,它至今仍是验证小片段基因的黄金标准。

正如“手抄书”一般,一代测序具有高成本、低效率的缺点,这严重影响了其真正大规模的应用。在一代测序的基础上,经过不断的技术开发和改进,以Roche公司的454技术、illumina公司的Hiseq技术和ABI公司的Solid技术为标记的第二代测序技术诞生了。

我们可以把二代测序比作“活字印刷术”:先把整本“生命说明书”撕成数以万计的小碎片,再为每个碎片编号,然后同时给所有碎片测序,也就是同时印刷这些碎片,最后用计算机把这些碎片按编号拼凑出完整的书。

(图2:illumina测序技术原理图)

第二代测序技术大大降低了测序成本的同时,还大幅提高了测序速度,并且保持了高准确性,以前完成一个人类基因组的测序需要3年时间,而使用二代测序技术则仅仅需要1周。

二代测序为了测序效率把DNA打成了很小的碎片,这也就意味着它的读长特别低,也就是一次印刷的文字特别少。而三代测序(也叫长读长测序)就有效地解决了这一痛点:它就像一台高清扫描仪直接扫描完整本书,直接读取长达几万甚至几十万个碱基的完整DNA片段。

三代测序主要分为两个主流阵营:

一是单分子荧光测序,我们把DNA聚合酶固定在一个小孔底部,让它一边复制DNA,一边用激光实时拍摄—-每加入一个碱基,就会发出不同颜色的光。最后通过荧光颜色,就能拼凑出DNA的碱基顺序了。

另一个阵营是纳米孔测序,我们在一个薄膜上打一个极其微小的“纳米孔”,让DNA链像穿针一样穿过这个孔。不同的碱基通过时,会引起不同的电流变化,电脑根据电流波形,就能实时判断出通过的碱基是A、T、C还是G。值得一提的是,中国农业科学院深圳农业基因组研究所2025年发布的EasyAmplicon 2.0工具已经能够实现双核处理器环境下2小时完成2万条读长,这是一项十分惊人的技术突破。

(图3:三代测序技术原理图)

(图4:三代测序技术比较分析)

从桑格用几年时间读完5000多个碱基,到今天一个人花几百美元、两天就能拿到自己的全基因组数据——基因测序的发展速度,比电子设备的更新换代还要夸张。

而每一次测序技术的更迭,都可能代表着我们能更快、更好地帮助患者找到病因;更及时地锁定新型病毒;更精准地设计个性化诊疗方案……

DNA测序,不仅仅是简单读懂A、T、C、G的排列顺序,更是让我们寻找到生命的答案。

来源网址:从一代测序到三代测序,我们如何读懂“生命的说明书”?——揭开DNA测序的奥秘