NatMethods克服PCR扩增误差:利用同源三聚体核苷酸提高测序数据质量

2024-02-0718:01发布于江苏科学领域创作者

引言

现代生物学研究中,准确地量化RNA和DNA分子至关重要,尤其是在单细胞测序和癌症基因组学等领域。独特分子标识符(UMI)是一种革命性的技术,它通过为每个分子附加一个独特的序列标签来实现这一点。这种方法可以有效地消除PCR扩增过程中的偏差和错误,从而提供更准确和可靠的数据。通过使用UMI,研究人员能够对测序样本中的每个原始分子进行精确计数,从而大大增强了数据的质量和解释力。

尽管UMI技术在提高测序数据质量方面取得了显著进展,但PCR扩增过程中引入的错误依然是一个挑战。这些错误不仅会增加假阳性率,还会影响到UMI的准确识别,从而对数据的解读造成影响。因此,如何有效识别和校正这些错误,成为了提高测序准确性的关键。

2024年2月5日发表于Naturemethods(IF47.99)上的研究“CorrectingPCRamplificationerrorsinuniquemolecularidentifierstogenerateaccuratenumbersofsequencingmolecules”提出了一种新的方法,通过采用同源三聚体核苷酸块来设计UMI,有效地减少了PCR扩增过程中的错误。这种设计不仅提高了UMI的稳定性和准确性,还为高通量测序技术提供了一种新的解决方案。研究结果表明,这种新型UMI能够在不同的测序平台上提供更为准确的测序数据,为今后的基因组学研究和临床应用开辟了新的道路。

独特分子标识符(UMI)的设计与合成

UMI的基本原理及其在序列分析中的应用

独特分子标识符(UMI)是一串能够唯一标记单个分子的随机序列,它使得科研人员能够在高通量测序过程中区分和量化每一个原始分子,即使在经过PCR扩增之后。这一技术极大地提高了测序数据的准确性,使得从单细胞测序到复杂样本分析的各种应用都变得更加可靠和精确。

采用同源三聚体核苷酸块设计UMI

为了进一步降低PCR扩增过程中引入的错误,该研究采用了一种创新的UMI设计策略——同源三聚体核苷酸块。这种设计利用了三个连续相同的核苷酸作为UMI的基本单位,以增强UMI在测序和数据分析过程中的稳定性和可辨识度。同源三聚体的结构设计不仅能够有效减少由于PCR或测序错误导致的误识别,还可以通过简化错误校正算法来提高数据处理的效率。

使用基于同源三聚体UMI的方法提高大规模mRNA测序的准确性,以减少PCR引起的错误(Credit:Naturemethods)

合成方法与实验验证

该研究中UMI的合成采用了固相合成技术,通过精确控制化学合成过程,确保了UMI序列的高度一致性和纯度。合成完成的UMI经过一系列的生物化学实验进行验证,包括PCR扩增稳定性测试、测序准确性分析以及与传统UMI设计的比较实验。结果表明,采用同源三聚体核苷酸块设计的UMI在减少PCR扩增错误、提高测序数据准确性方面表现优异,验证了这一设计策略的有效性和应用潜力。

PCR扩增错误的检测与校正

PCR错误类型及其对UMI准确性的影响

在高通量测序技术中,PCR扩增是不可避免的步骤,其目的是增加样本的数量以满足测序需求。然而,PCR扩增过程中容易引入错误,包括错配、插入和缺失等,这些错误会直接影响到UMI的准确性和测序结果的可靠性。特别是在需要高度精确的单细胞测序和低丰度样本分析中,PCR错误的影响尤为显著。

同源三聚体UMI的错误检测方法

为了有效检测和减少PCR引入的错误,该研究采用了同源三聚体UMI设计。这种方法基于一个简单的原理:通过分析三聚体内的同质性,可以有效地识别和校正那些由PCR引起的随机错误。具体来说,如果在一个三聚体内出现两个或三个相同的核苷酸,则可以认为该位置没有错误,或者错误已被自然校正。如果三个核苷酸全不相同,则该位置很可能发生了PCR错误,需要进一步的校正处理。

错误校正策略与效率评估

针对检测到的错误,该研究开发了一套高效的错误校正策略。这套策略包括两个关键步骤:首先,对于每个UMI,通过比较其所有可能的三聚体组合,识别出错误最少的序列作为正确的UMI序列;其次,利用这个正确的UMI序列来替换原始数据中所有相应的错误UMI,从而实现错误的校正。通过这种方式,不仅能够有效降低由PCR错误引入的假阳性率,还能够显著提高数据分析的准确性和可靠性。

该研究中,错误校正的效率通过一系列实验进行了评估。实验结果显示,采用同源三聚体UMI的错误检测与校正策略,相比传统UMI设计,能够更有效地减少PCR错误,提高UMI的准确性。这一发现对于提升高通量测序数据的质量具有重要意义,尤其是在那些对数据准确性要求极高的应用场景中。

同源三聚体UMIs在单细胞测序中提高差异表达的准确性(Credit:Naturemethods)

UMI技术的改进和优化仍有广阔的空间。未来的研究可能还可以从以下几个方面进行探索:首先,进一步优化UMI的设计,包括探索不同的核苷酸块组合和长度,以适应更广泛的测序应用需求;其次,开发更高效的错误检测和校正算法,提高数据处理的速度和准确性;最后,加强UMI技术与各种测序平台的兼容性研究,确保其在不同测序环境下的稳定性和可靠性。

THE END
1.探秘RNA测序的高效工具——umis最后,通过tagcount命令,umis基于伪对齐结果,仅统计唯一UMIs,特别是在有足够证据支持的基因-UMI配对上,实现了高度可靠的表达量估算。 3.项目及技术应用场景 umis特别适合单细胞RNA测序数据分析,能够显著提升基于分子标签的表达量估算准确性。无论是探索特定细胞类型的功能、疾病模型中的基因表达差异还是进行复杂的细胞群体https://blog.csdn.net/gitblog_00903/article/details/141668251
2.分析带UMI标签的测序数据xiaojikuaipao分析带UMI标签的测序数据 20条回复 分析带UMI标签的测序数据 检测癌组织的低频突变,为了提高检测低频突变的灵敏度,往往进行高深度的测序。但样本之间存在交叉污染,测序有存在一定概率的错误,这些因素会导致高深度测序过程中将假阳性的信号放到,得到假阳性的结果。解决https://www.cnblogs.com/xiaojikuaipao/p/14976793.html
3.UMI转录组测序产品介绍UMI 转录组测序,在文库扩增前为每一条逆转录的 cDNA 添加唯一的分子标签,标签伴随着片段扩增、测序和分析的全部过程,在保证精准定量的前提下,能够既可以检测基因表达水平差异,又可以提供结构分析, 还能发现稀有转录本,精确地识别可变剪切位点、基因融合等。 https://www.novogene.cn/novo/umi-zlz_cpjs_166.html
4.提升UMI分析精度和计算效率:SentieonUMI分子标记处理模块在我们的模拟数据测试中,我们分析了统计模型给出的质量值和实际的错误率之间的关系,针对所有模拟的情况,包括不同的单链、PCR和测序错误率。从上图统计中我们发现,我们给出的质量值高度准确的体现了这些统计过程的所引入的随机错误。这证明了Sentieon UMI不但在建立consensus序列上有极高的正确性,同时也能为每个consenshttps://cloud.tencent.com/developer/article/2305469
5.绝对定量转录组测序——拯救你的微量样本企业动态别着急小编今天就给大家介绍两种绝对定量测序:UMI mRNA-seq和UMI miRNA-seq,完美解决样本量不够的问题,顺便还能得到比常规测序更精准的结果,大家一起来了解一下。 什么是绝对定量测序 传统RNA-seq 定量分析过程中,由于建库过程中PCR 对片段长度和 GC 碱基含量的偏好会导致部分文库片段丰度失真,进而对定量结果产生影响https://m.biomart.cn/news/16/3160411.htm
6.单细胞+分子标签!Takara推出全新单细胞测序试剂盒测序中国添加UMI也能构建高质量单细胞文库 对FACS分选的单个外周血单核细胞使用SSmRNA(不含UMI)或SSmRNA + UMIs生成测序文库,然后进行建库分析(使用CogentAP处理)。 结果显示,虽然添加UMIs,但两者的基因检测数和reads分布基本一致,也表明数据质量不受影响。 与Smart-seq2数据比较 https://www.shangyexinzhi.com/article/10935752.html
7.唯一分子标记(UMIs)确保测序的准确性软件和分析 服务 热门产品 浏览所有产品 仪器 测序平台 芯片扫描仪 所有仪器任何地方,任何实验室 使用NGS测序,以无与伦比的简便性和难以想象的速度 了解MiSeq i100 系列 试剂盒和试剂 文库制备试剂盒 测序试剂 芯片试剂盒 临床研究产品 所有试剂盒和试剂 NextSeq 1000和NextSeq 2000试剂盒 NextSeq 1000和Nehttps://www.illumina.com.cn/techniques/sequencing/ngs-library-prep/multiplexing/unique-molecular-identifiers.html
8.一文读懂单分子标签UMI2. 仪器系统误差:最常使用的Illumina 测序仪来说,误差率在~0.05% 到 ~1% 之间,具体取决于读取长度、所用的碱基识别算法和测定的变异类型 。 01 UMI 是啥? 分子标签(Unique Molecular Indentifier,UMI)是一段随机化或特定的核苷酸短序列,通常设计为完全随机的核苷酸链(如NNNNNN),部分简并核苷酸链(如NNNRNYN, https://zhuanlan.zhihu.com/p/642835804
9.经典文章配合单细胞的组学看过来!华中农业大学作物遗传改良国家重点实验室在《Advanced Science》期刊上(IF=15.1)发表了题为“Single-Cell Transcriptome Atlas and Regulatory Dynamics in Developing Cotton Anthers”的研究论文,通过对单细胞测序结果进行分析,揭示了高温影响花粉壁形成导致雄性不育的新机理,为后续培育出耐高温种质提供了理论基础。 https://www.bilibili.com/read/cv34048599
10.BDRhapsody单细胞分析系统功能用途:单细胞的RNA-seq测序,基因表达分析。Onco-BC靶向检测,免疫反应检测,T-细胞靶向检测。 1、靶向基因检测,避免看家基因占用大量测序数据,节省测序和分析成本 2、靶向定制panel,选定特定基因组合,提高UMI计数效率,罕见转录本检测阈值更低。 3、引入单细胞测序金标准,BD分子标签,降低非特异性表达。 http://portal.smu.edu.cn/zxsys/info/1017/1570.htm
11.代码分析单细胞转录组质控详解51CTO博客NGS系列文章包括NGS基础、转录组分析 (Nature重磅综述|关于RNA-seq你想知道的全在这)、ChIP-seq分析 (ChIP-seq基本分析流程)、单细胞测序分析 (重磅综述:三万字长文读懂单细胞RNA测序分析的最佳实践教程 (原理、代码和评述))、DNA甲基化分析、重测序分析、GEO数据挖掘(典型医学设计实验GEO数据分析 (step-by-stephttps://blog.51cto.com/u_16077014/6240207
12.cfDNA(带UMI标签的fq数据WES)的生信处理call突变流程UMI简介 UMI(unique molecular identifer)是一种用来降低二代测序实验误差(sequencer, polymerase, DNA damage error and so on)的有效技术。建文库时在adapter处加入UMI,在生信分析时通过UMI区分真阳性突变和假阳性突变,提高检测的Sensitivity和Specificity。 https://www.jianshu.com/p/0e6520bdd1df
13.NatMethod丨校正UMI中的PCR扩增错误以生成测序分子的准确数量随后,作者使用ONT的PromethION平台对经历20和25个PCR循环的文库测序,结果表明,通过在条形码区域内掺入同源三聚体,实现回收细胞数量的增加,尽管很低(~15%)。以ENST00000330494为例,对比单体UMI和经同源三聚体校正的差异分析,发现单体UMI去重复导致20和25个循环文库之间超过300个差异调节的转录本,然而,同源三聚体校正后https://www.hanlab.net/newsinfo/7381297.html
14.转录组数据分析软件(分析转录组数据用什么软件)Seurat软件是一个R包,可以说是单细胞转录组测序分析的明星软件,很多单细胞测序文章都会引用该软件,引用次数也是杠杠的,而且也有详细的 在线教程 。本文也主要是根据其教程介绍一下使用Seurat软件分析一个样本的单细胞转录组数据的步骤及注意事项,供大家讨论。 https://www.huoban.com/news/post/121612.html
15.低频突变分析DNACap来源于 2 个健康捐献者的血浆游离 DNA 以 1% 比例混合,用于模拟游离血浆 DNA 中低频突变位点的检测,文库制备总投入量为 10 ng;针对已知 SNP 位点设计捕获 panel(图3)。通过 Illumina HiSeq X, PE150 平台测序后,利用双端分子标签(UMI),在不同分析与过滤方法下进行低频突变分析(表3)。 https://www.njnad.com/DNACap/389.html