人工智能让育种“物美价廉”

640?wx_fmt=jpeg

预测二元化基因表达量的卷积神经网络模型建立

来源:中国科学报


自从作物被驯化以来,培育集抗性强、优质、高产等性状为一体的作物品种一直是育种家的梦想。DNA分子结构模型的发现推动了分子生物学的发展,让育种家们能够从基因和分子水平上解码作物的生命秘密,通过调控基因获得特定表型,以期培育出最想要的作物品种。


然而,如何调控作物基因才能培育优良品种?如何不用大规模田间试验就能预测基因变异后的作物生长状况?时至今日,这些问题依然困扰着育种学家们。


近日,中国农业科学院生物技术研究所副研究员汪海与合作者共同开发出从基因组DNA序列预测基因表达调控模式的人工神经网络模型,有望借助人工智能(AI)技术实现定向育种。相关成果发表在《美国科学院院刊》上。


从经验到精准定向


育种,从某种意义上来说,是把来自不同种质资源的优良等位基因聚合起来。


作物育种经历了漫长的改良之路。传统育种是耕作者对作物表型变异的肉眼观察,通过主观判断选出高产优质抗性强的育种材料。后来,职业育种家出现,他们根据对作物遗传规律的认识,通过预先设计杂交育种试验,再从后代中筛选出优良栽培品种。

这些方法曾为作物改良、有效解决粮食安全问题作出了巨大的贡献。但在某种程度上,却都是基于经验和观察,完全根据表型对育种材料进行选育的“经验育种”。科学家曾“无奈”而又形象地将其形容为“一把尺子一杆秤,用牙咬,用眼瞪”。


“作物表型易受环境、气候等因素影响,依赖于经验育种效率低,且成本高、田间管理难度大。过去几十年甚至上百年来,基本是沿用这种方式,并无大的突破。”华南农业大学生命科学学院教授王海洋告诉《中国科学报》。


直到20世纪50年代,分子生物学与基因工程的诞生,打开了人类认识生命本质的大门。作物育种从经验育种时代进入了分子定向育种时代。这个时期,育种家可在明确基因型的表型效应的情况下,有的放矢地把符合预期要求的基因型进行组合。


“找到控制作物最佳性状的基因,对其进行标记,在后代中监测追踪,从而有目的地对单一目标性状进行基因改良,大大提高了育种效率和精确度。”王海洋说。


然而,伴随着高通量基因组测序技术的发展,越来越多的作物全基因组密码被解开。在海量的基因组数据面前,控制优良性状的基因是哪些?怎样的基因组合才能产出最优的作物品种?上述分子标记有效利用与定向育种的先决条件,人们却不得而知。


汪海表示,明确哪些分子标记和哪些性状相关联,需要借助机器学习模型或深度学习模型帮助育种家根据基因型预测表型。人工智能技术突破了人的经验,使作物育种更加精准而高效。


深度学习模型帮助预测优势品种


机器学习是借助计算机算法建立模型并解析数据,通过不断学习数据的自身特征并训练模型,从而实现对目标对象的判断和预测。


汪海告诉《中国科学报》,传统的基于线性模型的机器学习方法由于不考虑生物学过程背后的分子机制,造成模型不会“举一反三”,在某个基因上学习到的特征不能运用到相似分子机制的基因,而且不能有效预测低频、罕见变异的表型效应。以玉米为例,玉米自然群体中就有超过50%的变异属于低频、罕见变异。


以基因组序列为预测变量的深度学习模型可以克服这一难点。


研究人员以基因家族代替单个基因为单位随机分配训练集和测试集数据,以解决“进化依赖”造成的模型“过拟合”问题。接着进一步利用多种算法对模型进行解析,获得了调控基因表达的关键DNA基序。在此模型基础上,研究人员利用进化上亲缘关系较近的两个物种,成功预测了同源基因的相对表达量,并进一步获得了调控同源基因相对表达量的关键DNA基序。


汪海表示,深度学习模型通过模拟分子生物学过程,可在自然群体中预测直接造成表型的因果变异,而非和因果变异紧密连锁的变异。未来可以针对因果变异进行基因组编辑,直接将有利自然变异引入现有的育种材料。


此外,与传统高投入、大规模的田间试验相比,人工神经网络模型可在计算机中对基因组DNA序列进行虚拟诱变,并利用模型预测变异的后果。“从而再挑选符合预期目标的变异序列进行实验验证,实现低成本定点定向设计育种。”汪海说。


智能化育种4.0时代


“这是作物优良基因挖掘方法的突破,也代表了未来的发展方向。”中国农业大学农学与生物技术学院植物遗传育种学系教授、国家玉米改良中心主任李建生告诉《中国科学报》。


以人工神经网络为代表的新一代人工智能技术具有更强大的数据挖掘能力,正推动作物育种走向智能化的“4.0”时代。


中国农业大学作物基因组与生物信息学系教授王向峰撰文以玉米为例,对育种“4.0时代”进行了详细的阐释:依托人工智能、基因组测序、基因编辑等相关技术,实现玉米组学基因型与表型大数据的快速积累,通过遗传变异等数据的整合,实现作物性状调控基因的快速挖掘与表型的精准预测,通过人工改造基因元器件与人工合成基因回路,使作物具备新的抗逆、高效等生物学性状,并通过在全基因组层面上建立机器学习预测模型,创建智能组合优良等位基因的自然变异、人工变异、数量性状位点的育种设计方案,最终实现智能、高效、定向培育新品种。


在人工智能技术辅助育种方面,美国农业公司已有应用。比如原孟山都公司,通过人工智能筛选,只需对最具开发潜力的品种分子进行田间测试,即可帮助农民增收。此外,借助机器学习和预测建模技术,快速为农民提供数字化解决方案。


“中国要实现应用还有一段路程要走。”李建生表示,与国外农业公司种业集中度高、规模大相比,中国种业公司多为“作坊式”生产且分布分散,要实现高通量的基因筛选与预测,需要改良适合中国种业发展的模型和方法。


在研究方面,汪海坦承,目前,把深度学习等人工智能技术应用于基因组学领域在国内外都刚刚起步。


在他看来,阻碍人工智能技术在基因组学中广泛应用的因素之一是跨领域人才缺乏。“基因组学领域的人需要学习和掌握人工智能技术方法,并根据基因组学领域问题的特殊性,对人工智能技术进行改造。”


除此之外,训练深度学习模型需要大量的数据。然而在农业领域,作物的基因型和表型数据量却积累不足。


王海洋建议,研究人员在育种后,除了留下优质品种数据,也要保存非理想型品种的全套基因组和表型数据,以便数据建模时进行优劣比较,找出调控优良表型性状的基因。


大数据时代下智能化育种的前提是标准化大数据体系。而农业数据采之不易且不统一,王海洋表示,作物表型数据差异性较大,不同人采集的数据真实可靠性与准确性也难以控制。除此之外,彼此数据不开放共享,使得研究中可比较的数据量少。“有数据是第一步。对数据进行规范化采集处理、存储与管理,并建立开放共享的数据库更重要。”


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mzph.cn/news/492418.shtml

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Socket编程应用——开发聊天软件

1、客户端应用程序开发 建立一个基于对话框的MFC应用程序,创建的时候记得勾选【Windows Sockets】,其 他的默认就行。 (1)、对话框如图所示: (2)代码如下: // ChatClientDlg.cpp …

MFC中给单文档程序添加背景图片

1、在OnDraw函数中修改如下: void CBitmapView::OnDraw(CDC* pDC) {CBitmapDoc* pDoc GetDocument();ASSERT_VALID(pDoc);// TODO: add draw code for native data hereCBitmap bitmap; //位图类对象bitmap.LoadBitmap(IDB_BITMAP1); //从资源中装载入位图CDC dc…

详解|清华大学100页PPT:工业机器人技术详解

来源:清华大学未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网&#…

2019年,中国要推进这70个工程项目

来源:人民日报客户端摘要:近日,《关于2018年国民经济和社会发展计划执行情况与2019年国民经济和社会发展计划草案的报告》正式发布。报告详尽地对2019年我国经济社会的发展做出了安排。围绕基础设施建设、创新发展、社会民生、生态治理、文化…

判断101-200之间有多少个素数,并输出所有素数。

1、代码如下&#xff1a; // test.cpp : Defines the entry point for the console application. // /* 判断101-200之间有多少个素数&#xff0c;并输出所有素数。*/ #include "stdafx.h" #include <iostream> #include <cmath> using namespace std;in…

输入一个十进制数,转化为二进制

1、代码如下&#xff1a; // test.cpp : Defines the entry point for the console application. // /* 输入一个十进制数&#xff0c;转化为二进制。*/ #include "stdafx.h" #include <iostream> using namespace std;int main(int argc, char* argv[]) {cout…

超越“机器人三定律” 人工智能期待新伦理

来源&#xff1a;新华网人工智能的伦理原则近来备受关注。联合国教科文组织总干事阿祖莱在3月初举行的“推动人性化人工智能全球会议”上就表示&#xff0c;目前还没有适用于所有人工智能开发和应用的国际伦理规范框架。对于科幻作家阿西莫夫上世纪设计、防止机器人失控的著名“…

求5阶矩阵其对角线上所有元素之和

1、代码如下&#xff1a; // test.cpp : Defines the entry point for the console application. // /* 输入一个5*5的矩阵&#xff0c;然后输出其对角线上所有元素之和。 当求N阶矩阵其对角线上所有元素之和时&#xff0c;只要把以下程序中所有的5改成N,4改成N-1即可。*/ #inc…

DARPA“终身学习机器”项目取得重大进展

来源&#xff1a;DARPA网站2019年3月&#xff0c;美国防高级研究计划局&#xff08;DARPA&#xff09;“终身学习机器”&#xff08;L2M&#xff09;项目研究人员在《自然机器智能》杂志发表了其有关人工智能算法的研究结果&#xff0c;介绍了一种由类似动物肌腱驱动的人工智能…

《自然》,工程学突破!仿生物细胞群体机器人问世

来源&#xff1a;科技日报摘要&#xff1a;北京3月20日&#xff0c;英国《自然》杂志20日发表了一项工程学最新突破&#xff1a;美国科学家团队研发了一种能模拟生物细胞集体迁移的机器人&#xff0c;可实现移动、搬运物体及向光刺激移动。北京3月20日&#xff0c;英国《自然》…

白宫启动AI.GOV计划,呼吁各界携手共同推进AI发展

来源&#xff1a;网络大数据摘要&#xff1a;近日&#xff0c;白宫启动了 ai.gov 计划&#xff0c;列出了特朗普政府与美国联邦机构采取的一系列人工智能举措&#xff0c;如美国国立卫生研究院(NIH)利用 AI 展开的生物医学研究项目以及美国交通部近期发布的关于自动驾驶汽车的报…

Qt连接MySQL数据库

1、将MySQL安装目录下的libmysql.dll拷贝到Qt安装目录下的bin目录中。 2、准备数据库和数据表如下&#xff1a; 3、编写如下代码&#xff1a; #------------------------------------------------- # # Project created by QtCreator 2016-07-15T17:56:50 # #----------------…

边缘计算不再“边缘”

来源&#xff1a;中国科学报摘要&#xff1a;5G商用时代来临&#xff0c;数据量将更加巨大、复杂&#xff0c;对计算提出更高要求&#xff0c;同时也为发展人工智能、边缘计算带来了新机遇。5G商用时代来临&#xff0c;数据量将更加巨大、复杂&#xff0c;对计算提出更高要求&a…

Qt中修改应用程序和标题栏的图标

一、修改应用程序图标 1.新建一个my.txt文件&#xff0c;打开后在其中加一句 “IDI_ICON1 ICON DISCARDABLE "应用程 序图标.ico"”。&#xff08;“应用程序图标.ico”是要添加的图片名&#xff0c;图片格式一定要是.ico), 然后保存并退出&#xff0c;将文件格式改为…

人类“第六感”首次被证实,研究发现人脑具有磁场感应能力

新证据表明&#xff0c;人类磁感可以让大脑感应到地球磁场来源&#xff1a;神经科技摘要&#xff1a;科学界已经知道鸟类可以利用地磁场进行导航&#xff0c;除此之外&#xff0c;科学家在自然界许多物种中都发现了磁感应能力&#xff0c;生物的磁感受能力也一直在业内被称作生…

用S-函数编写Simulink中的正弦模块

1、用S-函数实现一个正弦波信号源。要求其幅度、频率和初始相位参数可由外部设置&#xff0c;并将这个信号源进行封装。 S-函数程序代码如下&#xff1a; function [sys,x0,str,ts] ch2example17Sfun(t,x,u,flag,Amp,Freq,Phase) % 正弦波信号源 switch flag, case 0 …

2019计算与系统神经科学大会Cosyne 前沿研究汇总

来源&#xff1a;混沌巡洋舰摘要&#xff1a;计算神经科学是一门超级跨学科的新兴学科&#xff0c;几乎综合信息科学&#xff0c;物理学&#xff0c; 数学&#xff0c;生物学&#xff0c;认知心理学等众多领域的最新成果。关注的是神经系统的可塑性与记忆&#xff0c;抑制神经元…

MATLAB中的S-Function的用法(C语言)

1. S-Function简介 S-Function是system-function的缩写。说得简单&#xff0c;S-Function就是用MATLAB所提供的模型不能完全满足用户&#xff0c;而提供给用户自己编写程序来满足自己要求模型的接口。 2. MEX函数与M文件的区别 第一&#xff0c; MEX 函数能实现的回调函数比…

一文读懂民航客机飞控系统

来源&#xff1a;传感器技术摘要&#xff1a;埃塞俄比亚航空公司波音737 MAX 8型客机当地时间10日坠毁&#xff0c;这是时隔不到5个月&#xff0c;波音同一型号飞机发生的第二起空难。鉴于两起事故具有明显的相似性&#xff0c;越来越多的将目标指向了该型号的设计缺陷——飞控…

VC创建DLL动态链接库及其调用

1.1 创建dll项目 1.2 为dll项目编写源文件 头文件dllDemo.hextern "C" _declspec(dllexport) int Sum(int a,int b);//加法函数。extern "C" _declspec(dllexport) int Max(int a, int b);//取较大值函数extern "C" _declspec(dllexport) int Mi…