物种鉴定笔记数据库选择和置信度得分对Kraken2分类性能的影响

开通VIP,畅享免费电子书等14项超值服

首页

好书

留言交流

下载APP

联系客服

2024.12.11湖北

Kraken2适用于大规模宏基因组分析,其性能受到参考数据库选择和置信度参数设定的直接影响。2024年7月,《aBIOTECH》发表研究论文,系统评估了不同参考数据库和置信度参数对Kraken2分类性能的影响。

综合参考数据库与中等CS(0.2或0.4)相结合可显著提高分类准确性和灵敏度。

由于此项研究基于模拟数据集,需要使用样本量更大的真实数据集进一步验证这些结果。此外,对强大计算资源的有限访问可能对某些研究人员来说是一个重大障碍,阻止他们有效利用大型参考数据库。因此,这种限制可能会影响研究建议的普遍性,因为它们可能不适用于资源有限的环境。在现实世界的研究中选择参考数据库和CS的最佳组合时,还应考虑计算资源和特定的科学问题。

在本研究中,研究人员使用已知细菌组成的模拟数据集系统地研究了参考数据库和CS的选择对分类率、精确度、召回率、F1评分的影响,以及“真实”和“估计”相对丰度之间的差异。

01

对分类率的影响

当使用Minikraken和Standard-16数据库时,分类率随着CS的增加而急剧下降,当CS超过0.4时,没有reads可以被分类。相比之下,当CS值为1.0并使用nt、Standard和GTDBr202数据库时,有相当多的序列可以被分类。CS为0时,使用Minikraken数据库的分类率最低。当CS值为0.2、0.4或0.6时,使用Standard、nt和GTDBr202数据库的分类率高于其他两个数据库。当CS值为0.8或1.0时,nt数据库的分类率高于除标准数据库外的其他数据库。

使用模拟宏基因组数据集对Kraken2中不同参考数据库(AMinikraken;BStandard-16;CStandard;Dnt;EGTDBr202)和置信度得分(0、0.2、0.4、0.6、0.8和1.0)分类的reads比例。

02

对精确度、召回率和F1分数的影响

在门和种水平上,Standard、nt和GTDBr202数据库的分类精度随着CS的增加而显著提高,但当CS为0.6或更高时,Minikraken和Standard-16数据库的分类精确度降至0。当CS为0时,Standard-16数据库在门和种水平上的分类精度更高。当CS在门和种水平上为0.2或0.4时,GTDBr202数据库的分类精度较低。当CS为0.6或0.8时,Standard、nt和GTDBr202数据库在门水平上的分类精度没有差异,但在种水平上,GTDBr202数据库的分类精度低于nt数据库。当CS为1.0时,在门和种水平上使用Standard、nt或GTDBr202数据库,分类精度没有差异。

在谱系和物种水平上,当使用Standard、nt或GTDBr202数据库时,或者当CS分别为0、0.2和0.4时使用Minikraken和Standard-16数据库时,分类的召回不受CS的影响。然而,对于Minikraken和Standard-16数据库,当CS高于0.4时,分类召回率降至0。在门水平上,当CS为0、0.2或0.4时,使用不同数据库的分类召回率没有显著差异,而当CS为0.6、0.8或1.0时,使用Standard、nt或GTDBr202数据库的分类召回率也没有显著差异。在种层面,当CS为0或0.2时,使用Standard-16和nt数据库进行分类的召回率高于使用Minikraken数据库进行分类,而当CS为0.4或更高时,使用Standard、nt或GTDBr202数据库的召回率更高。

与分类精度相似,当使用Standard、nt或GTDBr202数据库时,F1得分随着CS的增加而增加,但当Minikraken和Standard-16数据库的门和种水平的CS为0.6或更高时,F1得分降至0。当CS为0时,使用Standard-16数据库在门和种水平上的F1得分更高。当CS在门和种水平上为0.2或0.4时,GTDBr202数据库的F1得分较低。当CS为0.6或0.8时,在门级别使用Standard、nt或GTDBr202数据库时,F1得分没有差异,但在种级别使用GTDBr202数据库时,其F1得分低于使用nt数据库时的得分。当CS为1.0时,在门和种水平上使用Standard、nt或GTDBr202数据库,F1评分没有差异。

使用不同数据库(Minikraken、Standard-16、Standard、nt和GTDBr202)和置信度分数(0、0.2、0.4、0.6、0.8和1.0)在门(A)和种(B)级别进行分类的精确度、召回率和F1分数。

03

对计算出的细菌相对丰度

与真实相对丰度之间差异的影响

用kraken2对不同数据库和CS的真实数据集进行分类后,分类细菌的组成和相对丰度出现了变化。在门和种水平上,细菌的计算相对丰度与真实相对丰度之间的差异随着CS的增加而显著增大,但在门水平上使用标准数据库时除外。在任何CS条件下使用Minikraken数据库,以及在门和种水平的CS均为0.6或更高时使用Standard-16数据库,两者之间的差异明显增大。

在不同数据库(Minikraken、Standard-16、Standard、nt和GTDBr202)和置信度评分(0、0.2、0.4、0.6、0.8和1.0)下分类的细菌组成和相对丰度与门(A)和种(B)水平的真实数据集进行了比较。

在不同数据库(Minikraken、Standard-16、Standard、nt和GTDBr202)和置信度评分(0、0.2、0.4、0.6、0.8和1.0)中计算的细菌门相对丰度(log10转换)与细菌门真实相对丰度(log10转换)之间的差异。

在不同数据库(Minikraken、Standard-16、Standard、nt和GTDBr202)和置信度评分(0、0.2、0.4、0.6、0.8和1.0)中计算的细菌物种的相对丰度(log10转换)与细菌物种的真实相对丰度(log10转换)之间的差异。

THE END
1.miniaturemanuscript什么意思及同义词沪江词库精选miniature manuscript是什么意思、英语单词推荐 袖珍手稿本 相似短语 miniature manuscript袖珍手稿本 in manuscript以原稿形式 in miniatureadv.小型,小规模 unpublished manuscript未发表过的原稿或手稿 historical manuscript历史手稿 compilation manuscript编稿 https://www.hujiang.com/ciku/miniature_manuscript/
2.MANUSCRIPTSynonyms for manuscript from Random House Roget's College Thesaurus, Revised and Updated Edition ? 2000 Random House, Inc. Gennemse manumission manumit manumitted manure manuscript many many happy returns of the day many times many-colored https://dictionary.cambridge.org/da/thesaurus/manuscript
3.向ScienceChinaChemistry杂志投稿有什么要求?Science China Chemistry杂志是一本科技类SCI期刊, 创刊于1950年, 国内刊号11-5838/O6, 国际刊号1674-7224, 杂志获得过的荣誉有: Caj-cd规范获奖期刊、中国优秀期刊遴选数据库、等。https://www.youfabiao.com/scc/wenti/08.html
4.AppliedSciences影响因子整体趋势来看是稳步上升的,在2022年达到2.8,随后有一个小小的回落,最新的影响因子是2.5,但是不影响整体向上的态势。 分区 JCR分区:化学:综合Q2、工程:综合Q1、材料科学:综合Q3、物理:应用Q2。分区来看工程综合领域已经升到了Q1,排名第44位,表明其在该领域内的领先地位。 http://klxksci.com/zixun/75.html
5.乡村安装的大型净水机仿佛是守护着田野的除菌卫士在20世纪60年代,膜过滤技术问世,当时认为0.45微米的孔径为“除菌级”的标准。这种薄膜过滤器广泛应用于生物制品和液体药品的生产中,以去除细菌、酵母、霉菌和非生物颗粒物。但是,随着科学研究的深入,一些细小的微生物被发现能够穿透这些过滤网。例如,在60年代末期,美国FDA的一位科学家 Bowman博士发现了一种名为缺陷短https://www.hmpzcwadb.cn/yi-biao-yi-qi/527271.html
6.科学家发现COVID科学家发现COVID-19致命细胞因子风暴背后隐藏的诱因 科学家发现,免疫基因和 RAAS 系统的过度激活会导致严重的 COVID-19 病例中出现细胞因子风暴。这会导致广泛的炎症和器官损伤。作为 COVID-19 国际研究小组的一部分,来自约翰霍普金斯金梅尔癌症中心、费城儿童医院、匹兹堡大学和威尔康奈尔医学院的研究人员发现了细胞https://baijiahao.baidu.com/s?id=1818099917986507585&wfr=spider&for=pc
7.PS是什麼字體?眾識社區識字體網PS是什麼字體?客人發佈2024-12-11 11:14 機器識別結果 简 繁 日 更多功能 APCCourier-Bold 89% 商用须授权 Alice4 MX Bold 89% 商用须授权 HellasCour Bold 87.5% 商用须授权 PA-Courier Bold 87.4% 商用须授权 zco Narrow Regular 86.2% 商用须授权 ER Kurier Mac 85.7% 商用须授权 ER https://hant.m.likefont.com/community/112564063/
8.类器官的制造方法专利专利摘要:本发明涉及一种类器官的制造方法,该制造方法包括以下工序:使活体组织解离;以及将解离的所述活体组织以分散于培养基中的状态进行悬浮培养,其结果形成类器官,所述培养基实质上不含p38抑制剂,并包含下述成分i~iv:i0.1~10体积%的细胞外基质;ii胰岛素样生长因子1IGF?1;iii成纤维细胞生长因子2FGF?2;及https://guiyang.lotut.com/patent/6759114c03f9cd2e1c990d69.html
9.学术文献维基百科平台www.minimanuscript.com本站收录的"学术文献维基百科平台“数据均来源网站“www.minimanuscript.com”及互联网,以上数据具有时效性,因网站域名、网站名称及内容会受域名过期、网站服务器故障、域名所有者更替或内容变化,而存在以上内容失效、错误等情况,请多谅解。loading alexa data pic 网站常用标签 MinimanuScript 学术文献维基百科平台 http://www.948v.com/prodetail1493252.html
10.高效的文件检索网站soscholar这是一个用户可以自由地编辑优化,评论并添入音频、视频、图片等更多相关文件的平台,属于维基类学术文献百科。 在MiniManuscript上你能看到其他读者在读完某篇文献后整理出来的框架:这篇论文究竟用什么方法研究了什么问题,有了怎样的发现等。有希望成为一个更加开放更有效率的学术平台。 https://blog.csdn.net/MyLoveyaqiong/article/details/82121112
11.一个阅读论文共享阅读笔记的学术平台为了让阅读更有效率,节省看文献的时间, MinimanuScript应运而生,MinimanuScript聚合学者力量一起读文献共享阅读笔记,是一个人人可编辑的学术文献阅读笔记共享平台。学者在阅读文献的过程中可以做标记或笔记。在MinimanuScript平台,丰富多样的文献阅读笔记纪录是对一篇文献的补充材料,对文献阅读带来了许多便利。 https://byteclicks.com/2150.html
12.微博正文2.Citeseerx 免费论文搜索网 网页链接3.国家数据 网页链接4.Soscholar 天玑学术网 网页链接5.FindaRticles 文献论文搜索引擎 网页链接6.OCLC 学术论文搜索引擎 网页链接7.Arnetminer 研究者学术搜索网 网页链接8.SemanticScholar 免费学术搜索引擎 网页链接9.MinimanuScript 学术文献维基百科平台 网页链接https://m.weibo.cn/status/4310942340247106
13.VR在儿童孤独谱系障碍辅助治疗中的应用https://minimanuscript.com/manuscripts/autism-diagnoses-in-the-us-rise-by-30-c.pdf. [7] Xiang S, Allison C, Matthews F E, et al. Prevalence of autism in mainland China, Hong Kong and Taiwan:A systematic review and meta-analysis[J]. Molecular Autism, 2013, 4(1), doi:10.1186/2040-http://www.kjdb.org/CN/abstract/abstract14867.shtml
14.MeasurementofTimeDependentCPBELLE BELLE-CONF-0344 KEK Preprint 2003-47 Belle Preprint 2003-14 Measurement of Time-Dependent CP -Violating Asymmetries in B0 →φKS0 , K+K?KS0 and η′KS0 Decays K. Abe,7 K. Abe,41 T. Abe,7 I. Adachi,7 H. Aihara,43 K. Akai,7 M. Akatsu,20 Y. Asano,48 T. Aso,47http://arxiv.org/pdf/hep-ex/0308035
15.光明百科官網百科猜您可能感興趣的壹些網站知識 1、Reference 2、wikiHow 3、科普信息網 4、Minscraft百科 5、達意研 6、不列顛百科全書日本 7、MiniManuscript 8、維基百科 9、Dukten 10、秀峰百科網 11、國際樂譜文書館計劃 12、生活與健康的百科全書百科 花趣網 Biligame Wiki WebPedia.org網站百科 萌娘百科 醫學百科http://cht.0430wzk.com/cn/web114682/
16.学术文献维基百科平台MinimanuScript是一个用户可以自由地编辑优化,评论并添入音频/视频/图片等更多相关文件的平台,属于维基类学术文献百科。 友情提示 此页是<学术文献维基百科平台>的介绍页面,并非官方站点,我们收集于网络只为广大网民快速查询提供帮助。如涉及内容、版权等问题,请在30日内联系,我们将在第一时间删除内容!点此纠错或删除https://www.makvv.com/shop/wangwgzojfje855/