NatureComputationalScience[IF:N/A]
Large-scalemicrobiomedataintegrationenablesrobustbiomarkeridentification05-23,doi:10.1038/s43588-022-00247-8
赵方庆
赵方庆,中国科学院北京生命科学研究院研究员。先后获得中科院“百人计划”(2011)、基金委优秀青年基金(2017)、北京市杰出青年科学基金(2018)、国家杰出青年科学基金(2020)、中国科学院特聘研究员(2022)等资助。现任中科院北京生科院科研部副主任、技术平台部主任,中国生物信息学会基因组信息学专委会主任。主要致力于建立高效的算法模型和实验技术,探索人体微生物与非编码RNA的结构组成与变化规律,以期解析它们与人类健康和疾病的关系。近年来,在Cell、Gut、NatureBiotechnology、NatureComputationalScience、NatureCommunications等刊物上发表通讯作者论文50余篇,其中十余篇入选ESI高被引论文。先后4次荣获“中国科学院优秀导师奖”(2017,2018,2019,2021)以及“中国科学院大学领雁奖章”(2020)、“中国科学院朱李月华优秀教师奖”(2020)、“中国科学院大学必和必拓导师奖”(2021)。
问
答
随着测序技术的发展,我们产生的生物数据越来越多,但是如何有效地整合这些海量的数据并从中挖掘出有用的信息应用于临床的诊断一直是一个棘手的问题。肠道微生物的种类和丰度与基因表达阵列不同,它们更容易受到饮食、地域等各种因素的影响,不同人群之间肠道菌群组成可能存在很大差异,直接基于菌群丰度整合数据并进行生物标记物挖掘必然会产生偏差。此外,微生物丰度矩阵过于稀疏,常规计算方法也很难基于此稀疏矩阵对不同批次的丰度进行校正。
与其他方法相比,NetMoss在大规模的菌群数据整合以及生物标志物挖掘方面,有哪些特点和优势?
NetMoss最大的优势就是,它在整合数据和进行生物标志物挖掘时,并不是直接基于物种丰度,而是基于生态互作网络来实现的。通常情况下,肠道中的微生物并不是独立存在发挥作用,它们往往需要彼此协同合作,共同完成某一生命活动。通过构建微生物互作网络,我们可以很好地保留每一个子数据集最原始的生物互作信息,通过进一步的整合,我们就可以基于更庞大的数据进行生物标记物的挖掘。在进行标记物的识别时,我们同样也是基于不同微生物网络的结构差异来进行的。当人体的健康状况发生改变时,微生物种类、丰度和彼此之间的互作关系都有可能发生改变。我们通过量化不同健康状态下微生物互作网络的结构差异,可以更精准、更快速地识别出对扰动敏感的关键微生物,从而将其应用于临床疾病的诊断和预测。
NetMoss有哪些应用前景?
作为一个非常复杂的生态系统,肠道菌群对于机体免疫代谢的调节机制至今还仍处于研究的初级阶段。但是可以肯定的是,我们肠道中的细菌在人体内并不是单独发挥作用的,它可能通过与不同细菌的竞争或合作改变肠道生态系统的结构,也可能通过一些代谢物的分泌影响下游的多种功能通路。总之,相同的细菌可能会在不同疾病的发生发展过程中扮演不同角色,虽然作用各不相同,但都同样重要。这些细菌在人体代谢网络中的位置或功能发生改变,影响的不是单一的某一个组织或器官,而是我们的整个生命系统,因为人体本身就是一个有机的整体,我们不能孤立地看待任何一种生命现象。
菌群研究已经进入深水区。越来越多的研究者开始从生态系统的视角,探索肠道菌群及其在健康和疾病中的作用。请问这方面目前的研究进展是怎样的?
可否请您再介绍一下参与这项研究的团队成员,以及后续的研究方向?
(作者专访内容结束,以下是日报的其他内容)
NatureMicrobiology[IF:17.745]
Identificationofsharedanddisease-specifichostgene–microbiomeassociationsacrosshumandiseasesusingmulti-omicintegration05-16,doi:10.1038/s41564-022-01121-z
【主编评语】肠道菌群和宿主基因调控都可参与胃肠道疾病的发生发展,但尚不清楚这二者如何互作以影响宿主疾病。NatureMicrobiology近期发表的一项研究,建立了一个用于整合多组学高维数据集的机器学习框架,并用该方法在三种肠道疾病中,鉴定了疾病间特有和共有的宿主基因-微生物组关联,为进一步研究菌群影响疾病的机理提供了新线索。(@mildbreeze)
NatureMethods[IF:28.547]
①hifiasm-meta是在hifiasm的基础上,针对PacBio的HiFi宏基因组数据开发的组装软件;②在模拟数据集中,hifiasm-meta比metaFlye拥有更好的菌株区分度,比HiCanu耗时更短,三者准确性相当;③在真实数据集中,hifiasm-meta比其他软件可组装出更多兆级别和环状contigs,显著提升了下游宏基因组Binning性能,可获得更多高质量MAGs;④hifiasm-meta能很好区分来自素食者和肉食者混装样本得到的MAGs,说明其更擅长区分微生物间细微组分差异。
Metagenomeassemblyofhigh-fidelitylongreadswithhifiasm-meta05-09,doi:10.1038/s41592-022-01478-3
Microbiome[IF:14.65]
①在单样本组装和多样本混拼两种常用的宏基因组组装方法基础上,开发了一种混合组装方法(Mix-assembly),核心是将前两种方法得到的基因聚类,获得混合非冗余基因集;②混装方法在非冗余基因、完整基因和可注释功能基因数量上均显著优于其它两种方法;③混装基因集中低丰度基因主要源自多样本混拼,而高丰度基因则源自单样本组装;④使用混装方法对波罗的海环境样本重新分析,将原始基因集扩大了10倍,极大地拓展了样本中可利用信息。
Evaluatingmetagenomicassemblyapproachesforbiome-specificgenecatalogues05-06,doi:10.1186/s40168-022-01259-2
NucleicAcidsResearch[IF:16.971]
①vRhyme是一种快速和准确的病毒MAG分箱工具,经reads覆盖度处理、序列特征提取、有监督机器学习、迭代网络聚类及bin评分五步实现精准分箱;②vRhyme能够对不同家族、宿主和源环境隶属关系、不同片段化基因组及各种长度的病毒进行分箱;③与现有工具相比,vRhyme在模拟和真实数据集中分箱速度快、准确较高、兼容性强及计算需求低;④在人类皮肤数据中,vRhyme能更全面地分析一组个体中的共享病毒和病毒特征,并更好地再现自然系统。
vRhymeenablesbinningofviralgenomesfrommetagenomes05-11,doi:10.1093/nar/gkac341
①MDMcleaner专用于评估和过滤宏基因组组装基因组(MAG)、单细菌组装基因组(SAG)和参考基因组中的污染序列;②对基因组污染的评估优于其它可用工具,表现为对污染序列敏感性更高,对高度碎片化的MAG和SAG的假阳性率更低;③在之前被标记为低污染的基因组中发现了大量污染序列,提示应重新考虑现有基因组质量评价标准;④能过滤掉公共数据集中半数MAGs/SAGs中的污染,但对平均基因组完整性没有明显影响。
Howclearisourcurrentviewonmicrobialdarkmatter(Re-)assessingpublicMAG&SAGdatasetswithMDMcleaner05-10,doi:10.1093/nar/gkac294
【主编评语】本研究,作者提出了一种新的工作流程,作为检测和清除污染的替代策略,它可以意识到潜在的参考数据库污染,从而最大限度地减少错误传播的危险。作者为这个工作流提供了一个免费开放访问的python程序,名为“MDMcleaner”,一个重叠群分类和细化工具,并在模拟和真实数据集上对其进行了测试和比较。MDMcleaner揭示了当前筛选方法忽略的大量污染,并在新基因组和基础参考数据库中灵敏地检测出了错误分配的重叠群从而大大改善了我们对“微生物暗物质”的看法。(@刘永鑫-中科院-宏基因组)
NatureCommunications[IF:14.919]
①LookingGlass是一种“生命通用语言”深度学习模型,能直接对宏基因组中的reads进行高效地功能预测、注释和特定的酶挖掘;②LookingGlass能够捕获被传统方法遗漏序列的功能特征和序列之间的进化关系;③LookingGlass能准确识别短读长DNA序列中的编码区,实现高效地氨基酸翻译,还能对酶的最佳温度进行预测;④使用LookingGlass从全球海洋宏基因组数据中挖掘出大量未知的氧化还原酶,发现氧化还原酶丰度随纬度和深度分布的新趋势;
Deeplearningofabacterialandarchaealuniversallanguageoflifeenablestransferlearningandilluminatesmicrobialdarkmatter05-11,doi:10.1038/s41467-022-30070-8
①目前估计未培养的属和门分别占地球菌群的81%和25%,纯微生物培养物可用于研究微生物特性和生成参考基因组数据;②宏基因组组装基因组和单细胞基因组为鉴定和分离微生物/功能提供机会;③宏基因组数据指导的微生物分离策略包括培养基优化、抗生素抗性基因应用、稳定同位素探测引导的拉曼激活微生物细胞分选、反向基因组学和基因靶向分离;④制约这些策略的因素包括基因组序列不能确定培养某种微生物的所有必要条件,DNA提取方法等。
Opportunitiesandchallengesofusingmetagenomicdatatobringunculturedmicrobesintocultivation05-12,doi:10.1186/s40168-022-01272-5
Nature[IF:49.962]
Dietarydifferencescanconfoundanimalstudies05-23,doi:10.1038/d41586-022-01393-9
感谢本期日报的创作者:mildbreeze,一只赵崽儿呀,九卿臣,青城昊,往、昔℡,周梦情