合成酵母的科学杂志当期封面
来源:通信和互联网的扫地僧
2016年以来,以AlphaGo为标志的人工智能技术进入了发展的快车道,成为了民众热议的话题。2017年12月27日,华大基因董事长汪建在深商大会上表示,未来的5-10年,我们可以化学合成任何生命,人工生命(合成生命)的进展可能比人工智能还快。此言一出,立刻引起了巨大的反响。
汪建先生的话,源于2017年3月15日天津大学、清华大学和华大基因的科学家同时在科技界顶级杂志《科学》(Science)发表的四篇文章,这四篇文章分别描述了如何用化学的方法合成酵母基因组的4条染色体。这是构建人工生命的一个非常重要的进展。这项工作,入选了我国十大科技新闻和生命科学十大进展。
DNA与染色体
1、基因组和染色体都是什么?
地球上的不同生命或者不同物种,都是由其细胞内的遗传物质,即脱氧核糖核酸分子(DNA)决定的。DNA分子很特别,是一种双链的结构,含两条由四种不同核苷酸单体串起来的单链,以反向的双螺旋互相纠缠延伸。这四种核苷酸单体结构很相似,分为三个部分,其中二个部分的结构都是相同的,只有一个部分的结构不同,这部分结构叫“碱基”,根据碱基的不同,四种核苷酸单体分别叫 A、T、G、C。非常奇妙的是,A与T、G与C可以通过其碱基配对。DNA分子就是通过这些单体的配对而形成双链。一条单链上某个位置如果是单体A,对应的另外一条单链上必然是单体T。DNA双链分子结构,是1953年由美国科学家詹姆斯·沃森(James Watson)与英国科学家弗兰西斯·克里克(Francis Crick)发现的。他们后来得到了1962年诺贝尔生理或医学奖。
四种A、T、G、C单体的不同排列组合,就构成了每种生命的密码本。DNA双链分子上有不同的区域,有的代表基因,有的和基因调控相关,但是也有一些区域(比如细菌的DNA)甚至很多区域(比如人的DNA),我们其实还不知道有什么作用。奇怪吗?不奇怪。科学上还有太多太多未知。因为DNA双链分子上分布着基因,所以科学上通常又把一个物种的DNA统称为“基因组”。不同物种的基因组大小不同,通常以“百万碱基对”为单位。严格意义上,其实这是“百万核苷酸单体对”。但是生物学很特别,跟其他理工科不同,存在很多说法上的约定俗成,行外人可能哭笑不得,行内人倒习以为常。这里按下不表。
2、我们什么时候破译了各种生命的基因组序列或者密码本?
1970年代之前,我们其实不知道任何基因组的具体ATGC序列。其后,美国科学家沃特·吉尔伯特(Walter Gilbert) 和英国科学家弗雷德里克·桑格(Frederick Sanger)发明了DNA测序方法,并因此获得了1980年诺贝尔化学奖。特别值得一提的是,祖籍福州的美籍华人、美国康内尔大学吴瑞教授,对此方法做出了重要贡献。但是当时这项方法的效率和速度都比较低,只能用来测DNA片段、某个基因或者一些特别小的基因组。1977年,第一个完整的基因组,一种叫phi X 174的细菌病毒测序完成,只有5,386个碱基。为何这里的单位是“碱基”而不是前文的“碱基对”呢?因为这个病毒和很多病毒一样,比较特殊,其基因组是单链的DNA。严格意义上,病毒也不是完整的生命,只能算是生命的“寄生虫”。
进入1980年代,测序方法的不断改进和自动化,使得基因组测序工作得于迅速推进。1995美国科学家克雷格·文特尔(Craig Venter)领导的小组发布了第一个完整的能够独立生存的生命、流感嗜血杆菌的基因组序列,共 1,830,137 碱基对(或1.8百万碱基对),估计有1500个基因。流感嗜血杆菌是一种细菌,属于原核生物。1996年,科学家公布了第一个真核生物、酵母的基因组序列,大约有6千多个基因。上文提到的大肠杆菌,其基因组测序是1997年完成的,大约有4千多个基因。那大家肯定会想到,人类的基因组呢?人类基因组测序计划是在1990年启动的,2000年第一份草图完成,2004年正式完成,经历了15年,一共发现大约有2万多个的基因。如果我们把人类基因组的序列印刷成书的话,大约要262,000页,或者175本厚书。其它与人比较相近的哺乳动物基因组测序也先后相续完成。有意思的是,人们发现大猩猩的基因组与人基因组96%相似。
3、有基因组测序,就必有基因组合成,必有人工生命
人类很早就知道通过化学的方法合成短片段的DNA。通过这些短片段DNA的组装,科学家们开始探索化学合成基因组。很自然地,第一个合成的就是病毒基因组。2003年,同样是美国科学家文特尔小组,利用化学方法合成了上文提到的phi X 174的细菌病毒基因组。2005年,科学家们重新设计合成了另外一个叫T7的细菌病毒基因组。2008年,文特尔小组化学合成了一种叫生殖道支原体(Mycoplasma genitalium)的细菌基因组,长度约0.58百万碱基对,但是此时他们还没能把这个合成基因组移植到受体细胞中并证明其有生命的功能。2010年,这个小组人工合成了相近的丝状支原体(Mycoplasma mycoides)基因组,共1.08 百万碱基对,并移植到受体细胞中。一段时间后,该移植细胞完全由合成基因组控制。就这样,他们创造了人类历史上第一个真正意义的人工生命。当然,罗马不是一天建成的。文特尔小组是用了10多年的时间,才走到这一步的。根据时间推算,这项工作大约起始于本世纪初,即人类基因组测序的草图完成之时。
第一个人工生命 “辛西娅”
文特尔小组将这个人工生命命名为”辛西娅”(synthia)。这个人工合基因组,绝对大部分序列与该丝状支原体天然的基因组是一致的。但是该小组也加入了一些原先不存在的DNA序列(他们称之为“水印”)。其中蕴含了一些名言,比如“去生活、去犯错、去跌倒,去胜利、去从生命中重造生命”、“我无法建造的东西,我也不能理解”。后者出自加州理工学院的物理学家理查德·费曼(Richard Feynman)。
此后,人们又相继合成了其它细菌的人工生命。很自然,科学家们的下一个目标会是真核生物,显然,酵母是最好的选择。这项工作始于2005年,并逐步形成了一个中国科学家参与在内的国际“合成酵母计划”。科学家们首先选择了第3号染色体,这项工作主要由美国科学家杰夫·伯德(Jeff Bode)小组完成。天然的3号染色体原有316,667碱基对,他们对此进行了小心但是大量的工程设计或者说“重新编写”,最终人工的3号染色体含有272,871碱基对,比天然的少了13.8%。该染色体被导入酵母细胞,取代了原来的3号染色体,得到了第一个人工的酵母细胞。这项工作发表在2014年的《科学》杂志上。
4、人工生命与合成人
现在回到我们的题目:“人工生命离我们多远?”,答案其实是人工生命早就在我们的身边。这些合成生命,比如合成酵母,有重要的科学和经济价值。比如,合成酵母有助于人类更深刻地理解一些基础的生物学的问题;另一方面合成酵母有很多巧妙的工程设计,可以实现定向的人工进化,在医药、能源、环境、农业、工业等领域有非常重要的应用潜力。
现在问题是,下一步会不会是合成人的基因组、合成人?这个工作其实已经开始。2016年,国际上相关科学家已经开会讨论启动这个项目,有些观点已经发表在当年的《科学》杂志上。目前,一些基础性技术性工作已经在不同的国家不同的实验室开展。当然,从合成酵母的基因组到合成人的基因组,存在巨大的技术屏障。首先是规模上的难度,人的基因组是酵母的270多倍;其次是技术上的难度,比如染色体移植在酵母中比较容易实现,但是对于人体细胞,就非常困难。这些技术屏障,是否能够在5-10年得到解决,我们拭目以待。
未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。由互联网进化论作者,计算机博士刘锋与中国科学院虚拟经济与数据科学研究中心石勇、刘颖教授创建。
未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。
如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”