NVIDIAClaraParabricksv3的发布。6去年夏天,在全基因组和全外显子组测序分析综合工具包中添加了多个加速体细胞变异调用者和用于注释和质量控制VCF文件的新工具。
在2022年1月发布的ClaraParabricksv3中。7.NVIDIA将工具包的范围扩展到新的数据类型,同时继续改进现有工具:
通过加速实施FulcrumGenomics的fgbio管道,增加了对基于UMI的基因面板分析的支持
合并了一个bam2fq方法,该方法可以加速读取到新引用的重新对齐
使用ExpansionHunter增加了对短串联重复分析的支持
将呼叫后VCF分析步骤加快15倍
更新了HaplotypeCaller以匹配GATKv4.1,并将DeepVariant更新为v1.1
ClaraParabricksv3.7显著拓宽了ClaraParabricks的功能范围,同时继续投资于领先的全基因组和全外显子组管道领域。
使参考基因组与bam2fq和fq2bam重新对齐
重新调整后的变体调用的改进几乎与最初与hg38一致。虽然这个工作流程以前是可行的,但它的速度非常慢。NVIDIA最终将参考基因组更新应用于ClaraParabricks中最大的WGS研究。
RNASeq转录本定量和融合调用ClaraParabricks的更多选项
在3.7版中,ClaraParabricks还添加了两个用于RNASeq分析的新工具。
转录本定量是对RNASeq数据进行的最有效的分析之一。Kallisto是一种基于伪比对的快速表达量化方法。虽然ClaraParabricks已经将STAR纳入了RNASeq比对,但Kallisto添加了一种补充方法,可以运行得更快。
融合调用是另一种常见的RNASeq分析。在ClaraParabricks3.7中,Arriba提供了第二种方法,用于根据星形对齐器的输出调用基因融合。与恒星聚变相比,阿里巴可以调用更多类型的事件,包括:
病毒整合位点
内部串联复制
全外显子重复
环状RNA
涉及免疫球蛋白和T细胞受体位点的增强子劫持事件
内含子和基因间区域中的断点
Kallisto和Arriba的加入使ClaraParabricks成为许多转录组分析的综合工具包。
简化和加速基因面板和UMI分析
虽然全基因组和全外显子组测序在研究和临床实践中越来越普遍,但基因面板在临床领域占据主导地位。
图1。FulcrumGenomicsFgbio-UMI管道通过对ClaraParabricks的一个命令加速
使用ExpansionHunter检测短串联重复序列中的变化
短串联重复序列(STR)是某些神经系统疾病的公认原因,也是法医学和群体遗传学研究中指纹样本的重要标记。
NVIDIA通过在3.7版中添加对ExpansionHunter的支持,在ClaraParabricks中实现了这些位点的基因分型。现在完全使用ClaraParabricks命令行界面就可以轻松地从原始读取转换为基因型STR。
利用PON支持改善静音体细胞突变通话
根据已知正常样本中的一组突变筛选体细胞突变调用是一种常见做法,也称为正常组(PON)。NVIDIA在mutectcaller工具中增加了对公共PON集和自定义PON的支持,该工具现在为体细胞突变呼叫提供了GATK最佳实践的加速版本。
加速呼叫后VCF注释和质量控制
在v3中。在第6版中,NVIDIA添加了vbvm、vcfanno、frequencyfiltration、vcfqc和vcfqcbybam工具,使呼叫后VCF合并、注释、过滤、过滤和质量控制更易于使用。
v3。7版本通过完全重写vbvm、vcfqc和vcfqcbybam的后端对这些工具进行了改进,所有这些工具现在都更加健壮,速度提高了15倍。
总结
带有ClaraParabricksv3。7.NVIDIA致力于使Parabricks成为加速基因组数据分析的最全面解决方案。它是WGS、WES和现在的RNASeq分析以及基因面板和UMI数据的广泛工具包。
关于作者
JohnnyIsraeli是NVIDIA基因组学和药物发现软件的经理。他在斯坦福大学获得了博士学位,由AnshulKundaje担任顾问,他的论文专注于基因组学的深入学习。他拥有勘萨斯大学物理学硕士和数学学士学位。
审核编辑:郭婷
长沙市望城经济技术开发区航空路6号手机智能终端产业园2号厂房3层(0731-88081133)