机器学习技术加速植物精准设计育种科技前沿中国河南濮阳市科学技术局

种子被誉为农业的“芯片”,育种科技创新是推动农业发展的核心动力。未来植物育种的新范式是基因组学、基因编辑、合成生物学等生物技术(BT)与数据科学、机器学习、人工智能等信息技术(IT)的多元化融合。农业农村部“十四五”规划将“智慧种业”列在“智慧农业”领域七大攻关任务之首。任务中明确提出:构建数字化育种平台,探索基因型到表型的“智能育种技术体系”,加快“经验育种”向“精确育种”转变的攻关目标。

最近几十年,植物生物学基础研究产生了大量新的知识和数据,这些知识与数据最终将为植物育种与性状改良而服务。然而,实现植物精准设计育种的终极目标,还需要解决当前植物基础研究与育种实践脱节的问题。作为人工智能的一个分支,机器学习技术因其在整合复杂多变的生物学知识和组学大数据方面的卓越能力而得到广泛应用。

“知识”与“数据”驱动的精准设计育种。王向峰供图

机器学习主要可以通过两种途径在基础研究和育种实践中建立桥梁。一种途径是从植物生物学的基础研究中认识基因功能和调控机制,从而实现知识驱动的分子设计育种。在明确性状调控基因的功能后,通过分子标记辅助选择、有利等位基因的多基因聚合、基因编辑与合成生物学等技术,对植物品种进行定向改良。另一种途径是直接将机器学习技术应用于商业育种管线,构建各种预测模型和决策算法,从而实现数据驱动的基因组设计育种。

各类机器学习算法在植物多组学研究中的应用王向峰供图

论文首先介绍了现代机器学习技术的主要类型(包括监督式学习、半监督式学习、非监督学习、深度学习等)与最新进展;其次,综述了如何将现代机器学习算法应用于高维多组学数据降维、基因调控网络推断、多组学数据关联分析与基因挖掘,以及候选基因的优先级决策等植物学基础研究中;再次,介绍了基于半监督学习框架的深度学习算法在植物表型组学中的应用进展;最后,介绍了机器学习技术在全基因组选择辅助育种、基因型到表型预测,以及基因型与环境互作建模中的应用进展。在论文的结论与展望部分,讨论了目前机器学习和人工智能技术在植物研究中面临的挑战和潜在解决方案。

此外,本综述还提供了一个应用非监督学习案例,即:如何利用NMF非负矩阵分解算法提高玉米多组学数据关联分析的效率与基因挖掘的精度。

THE END
1.独家菜鸟级机器学习入门(附代码实例)现在当这些算法需要训练(Train)和校对(Calibrate)的时候, 其实是需要去找出一组点之间的最小距离。让我们看图更能说清楚。 以上图为例。这是一个经典的线性回归(Simple Linear Regression)的例子。蓝点表示想要预测的数据。红线表示“最佳拟和线”,该线是机器学习https://mp.weixin.qq.com/s?__biz=MzI1MjQ2OTQ3Ng==&mid=2247496248&idx=1&sn=ea19a9160d85b92060eafd4eeef8ce36&chksm=e9e1fbb3de9672a56e3c7c35792536e5abd1cf536d829beeeed52e1182059642c88e2b4ac4f7&scene=27
2.67页PPT,学透机器学习算法应用及数据处理(附下载)作为AI的重要分支,机器学习在推荐系统、在线广告、金融市场分析、计算机视觉、语言学、生物信息学等诸多领域都取得了巨大的成功。机器学习并不是像我们字面理解的那样,让冷冰冰的机器去学习,或者狭义的理解为让机器人去学习。 机器学习,从本质上来说,可以理解为算法学习(Algorithm Learning)、模型学习(Model Learning)或https://www.jianshu.com/p/fd5cff6ce3bf
3.机器学习实习记录:探索机器学习算法的实践与应用机器学习在这篇文章中,我将分享我的机器学习实习经历,包括实践项目的详细描述以及相应的源代码。通过这些实践项目,我深入了解了机器学习算法的原理,并将其应用于不同的领域,以解决现实世界中的问题。 项目1:房价预测 在这个项目中,我使用了一个经典的机器学习算法——线性回归,来预测房屋的价格。首先,我收集了一个包含房屋https://download.csdn.net/blog/column/12438025/133230425
4.张量神经网络机器学习算法及其应用题目:张量神经网络机器学习算法及其应用报告人:谢和虎 研究员 中国科学院数学与系统科学研究院)时间:2023年9月19日(星期二)15:00-16:00地点:宁静楼117室报告摘要:本报告介绍我们最近设计和发展的张量神经网络及其相应的机器学习算法,然后介绍其在求解高维偏微分方https://math.tongji.edu.cn/info/1385/10895.htm
5.机器学习及其应用——汪荣贵杨娟薛丽霞编著深度凝练机器学习的现有知识体系,注重突出对基本理论与关键技术的介绍和讨论。 尽可能用朴实的语言深入浅出地介绍机器学习理论及相关算法设计技术。 在每个章节穿插相应的应用实例,使得广大读者能够比较系统地掌握机器学习应用技术。 本书教学资源,样书可添加小编微信13146070618索取 《机器学习及其应用》比较系统地介绍机器学http://www.cmpedu.com/books/book/5600562.htm
6.字节跳动AI高级产品经理田宇洲:AI产品经理需要掌握的核心算法这个问题我们拆解开看,先说AI产品经理,我个人接触到的AI产品经理可以分为两类,一类是将机器学习和深度学习能力产品化的产品经理,如阿里PI,第四范式先知平台的产品经理,或者BI系统中负责机器学习算法模块组件化抽象的产品经理;一类是AI解决方案产品经理,也就是将AI技术(机器学习,深度学习等技术)应用于业务或用户使用场https://maimai.cn/article/detail?fid=1246742214&efid=hW5NlFAEkS-MHjfZl5IAxg
7.机器学习(32)之典型相关性分析(CCA)详解文末有福利【机器学习算法】:排名第一 【机器学习】:排名第一 【Python】:排名第三 【算法】:排名第四 人工智能与Python公开课 限时免费 文末领取 前言 典型关联分析(Canonical Correlation Analysis,简称CCA)是最常用的挖掘数据关联关系的算法之一。比如我们拿到两组数据,第一组是人身高和体重的数据,第二组是对应的跑步能力https://cloud.tencent.com/developer/article/1085170
8.BoostKit大数据业界趋势鲲鹏大数据组件增强特性和典型配置业务场景延伸,数据量爆发式增长,使得开源大数据机器学习算法的应用场景广泛而多样。但随之也带来了更大的挑战,开源算法收敛速度慢,硬件匹配度不足,导致很多场景算不了、算不快、算得贵。 鲲鹏应用使能套件BoostKit提供基于开源算法深度优化的机器学习算法,为开发者提供极致性能的大数据分析体验。 https://developer.huawei.com/consumer/cn/blog/topic/03898238728230088
9.数字化观察(100)华夏银行吴永飞等:数字金融领域小样本学习技术的机器学习算法模型 传统的商业银行风控体系以定性风险管理为主,主要使用风控规则及客户评级等方法,辅以线下尽调的方法;传统风控模型对包含客户历史行为和相关活动的数据进行分析,但难以预测性地揭示未来风险的变化情况,且数据获取方式单一、定量分析结果相对较弱。数字经济时代下面向数字金融发展,商业银行越来越强调运用金融https://bank.hexun.com/2022-05-31/206058282.html
10.《常用算法之智能计算(三)》:机器学习计算从更广泛的意义上来看,机器学习是人工智能的一个子集。人工智能旨在使计算机更加智能化,而机器学习已经证明如何做到这一点。简而言之,机器学习是人工智能的应用,通过应用从数据中反复学习得到算法,可以改进计算机的功能,而无需进行明确的编程。 在给出机器学习计算各种算法之前,最好是先研究一下什么是机器学习和如何对http://www.kepu.net/blog/zhangjianzhong/201903/t20190327_475625.html