北京大学生命科学学院

图片设计源于“八卦”,在此代表人类来自精子的父源基因组与来自卵细胞的母源基因组在受精后的“阴阳融合”。整幅画面传递着人类受精卵在发育过程中,父源基因组(金色蛇)染色质快速打开并且其开放程度迅速超过母源基因组(红色蛇),并将这一逆转的开放程度不对称状态一直维持到4-细胞胚胎阶段这一含义。

为了进一步在极限分辨率研究染色质状态在DNA甲基化重编程过程中的动态重构过程,该研究利用汤富酬课题组发展的国际领先的单细胞多组学测序技术(single-cellCOOL-seq),在单细胞、单碱基分辨率系统地描绘了人类着床前胚胎发育过程中,各个发育阶段表观基因组多个层面的动态变化。对于存在高比例非整倍体的样品(例如人类着床前胚胎、人类癌症样品等),利用少量细胞的表观基因组测序方法,例如ChIP-seq、ATAC-seq、DNase-seq等,得到的结果有可能会被混杂在样品中的异常的非整体细胞所混淆。因此该研究利用汤富酬课题组发展的scCOOL-seq技术,可以在单细胞水平有效地区分整倍体和非整倍体细胞,在排除非整倍体细胞后、利用整倍体胚胎的单细胞数据,更为精准地反映人类着床前胚胎发育过程中表观基因组多层面的动态变化。该研究的主要发现有:

(1)受精后的19个小时以内,高度特化的精子和卵子都经历了大规模的染色质重构过程,来自精子的父源基因组染色质被迅速打开,而来自卵细胞的母源基因组染色质的开放程度降低(精子的平均染色质开放程度为5%,卵子为42%,受精卵为34%)。随后父母源基因组染色质的开放程度同时回落,直至合子基因激活的8-细胞胚胎阶段之后染色质开放程度再次增加,到桑椹胚阶段染色质开放程度达到最高点(2-细胞的平均染色质开放程度为32%,4-细胞为30%,8-细胞为27%,桑椹胚时期为40%;图1a)。利用该研究鉴定出的61,403个近端染色质开放区域进行非监督层次聚类分析发现,和小鼠胚胎相似,在人类早期胚胎发育过程中,近端染色质开放区域具有强烈的发育阶段特异性,更重要的是近端染色质开放区域在合子基因激活时期,即4-细胞到8-细胞时期,发生了最剧烈的染色质重构过程,着床前胚胎聚类分为两支,一支是4-细胞阶段之前的胚胎,另外一支是8-细胞阶段之后的胚胎(图1b)。

图1:人类着床前胚胎(整倍体胚胎)发育过程中染色质开放程度的动态变化(a)以及近端(基因启动子区域)染色质开放区域的非监督层次聚类分析(b)

(2)首次发现不同于小鼠受精卵,人类受精卵在发育过程中父源基因组染色质快速打开并且其开放程度迅速超过母源基因组,并将这一逆转的父母源基因组染色质开放程度不对称状态一直维持到4-细胞胚胎阶段。该研究首次实现了在人类着床前胚胎的单个细胞内,将父母源基因组信息精确分开并进行DNA甲基化和染色质开放程度的分析(图2a)。在此基础上,该研究发现,人类受精卵在受精后19个小时左右,其父源基因组的染色质已经比母源基因组更为开放,并且这一不对称状态一直维持到4-细胞胚胎阶段才结束(图2b)。这与小鼠中完全不同,小鼠胚胎在受精后很快每个胚胎细胞中其父源基因组染色质的开放程度变得跟母源基因组的一样,并且此后一直维持这种父母源基因组染色质开放程度的对称状态。人类受精卵中父源基因组更快速打开并且开放程度迅速超过母源基因组,这可能更有利于DNA去甲基化酶在父源基因组上的结合,从而加速父源基因组的去甲基化进程以及其他表观遗传学重编程进程。

(4)首次发现受精后,人类雌性胚胎中父源X染色体迅速去甲基化并被激活,到2-细胞阶段后,父源X染色体的DNA甲基化水平已经远低于母源X染色体,并在此后一直维持这一逆转的不对称性。该研究可以精确地区分雌性和雄性胚胎,并在此基础上系统研究了人类雌性着床前胚胎中父母源X染色体的DNA甲基化和染色质开放程度的差异(图2d)。每个雌性细胞中有两条X染色体,其中一条来自精子(父源X染色体),另外一条来自卵细胞(母源X染色体)。scCOOL-seq技术可以基于杂合单核苷酸多态性(SNP)信息在每个单细胞中精确地区分父母源X染色体。该研究表明,与全基因组的DNA甲基化重编程和染色质状态重构特征一致,受精后,父源X染色体迅速去甲基化并被激活,到2-细胞阶段之后,父源X染色体的DNA甲基化水平已经显著低于母源X染色体的甲基化水平,并在此后一直维持这一不对称状态。与此同时,父源X染色体的染色质状态也迅速变得比母源X染色体更为开放,并一直维持到了4-细胞阶段。

图2:人类着床前胚胎发育过程中父母源基因组DNA甲基化与染色质开放程度的不对称分布(a,b),人鼠物种间父母源基因组染色体开放程度的比较(c)以及单个雌性胚胎细胞中父母源DNA甲基化与染色质开放程度的差异(d)

图3:各个元件DNA甲基化异质性(a)和染色质状态异质性(b),以及基因启动子区DNA甲基化异质性和染色质状态异质性的联系(c)

(6)通过转录抑制实验,首次发现,在人类着床前胚胎发育过程中,持续转录对于大量基因维持其启动子区域染色质持续处于开放状态具有重要作用。该研究发现,在人类和小鼠着床前胚胎发育过程中,合子基因激活伴随着启动子区域大片段(长度大于300bp)染色质开放区域比例的大幅度增加(图4)。使用RNA聚合酶抑制剂α-Amanitin处理受精卵、广谱抑制其转录活动,这些胚胎发育到8-细胞阶段时1700多个(35%)基因会失去启动子区域的染色质开放状态。这些依赖于持续转录的启动子大片段染色质开放区域对应的基因,很多都在胚胎发育过程中发挥重要作用,这说明持续转录对于维持大量胚胎发育重要基因启动子区域持续处于开放状态起了关键作用。

图4:持续转录对于染色质开放状态的维持是必须的

(7)对人类着床前胚胎进行了大规模的基因组调控区域预测,共得到37000多个候选增强子区域。利用scCOOL-seq数据,该研究结合染色质开放程度和DNA甲基化信息,进行了人类和小鼠的候选增强子预测。该研究发现对于人类和小鼠着床前胚胎中的染色质处于开放状态的候选增强子,只有700多个是在这两个物种中同时处于染色质开放状态,说明在着床前胚胎发育过程中处于活跃状态的增强子具有很强的物种特异性。与此同时,该研究对人类着床前胚胎中鉴定出的接近40万个染色质开放区域(NDR)进行了转录因子结合富集分析,发现相对于滋养外胚层细胞,多能性的内细胞团细胞中的远端(距离基因转录起始位点2kb以外)染色质开放区域更富集转录因子ZNF281的结合序列;而相对于内细胞团细胞,滋养外胚层细胞中的远端染色质开放区域更富集转录因子CDX2、TFAP2C(AP2γ)的结合序列,这为今后研究人类着床前胚胎发育过程中转录因子调控下游基因的表达提供了基础。

北京大学北京未来基因诊断高精尖创新中心博士生李琳、博士生高云,四川大学研究员郭帆,以及北京大学第三医院博士生任一昕为该论文的并列第一作者;汤富酬教授和乔杰教授为该论文的共同通讯作者。该项目得到了国家自然科学基金、国家重大科学研究计划、北京市科学技术委员会、北京未来基因诊断高精尖创新中心(ICG)、生命科学联合中心(CLS)等的资助。

参考文献:

ADDINEN.REFLISTGuo,F.,Li,L.,Li,J.,Wu,X.,Hu,B.,Zhu,P.,Wen,L.,andTang,F.(2017).Single-cellmulti-omicssequencingofmouseearlyembryosandembryonicstemcells.Cellresearch.

Yan,L.,Yang,M.,Guo,H.,Yang,L.,Wu,J.,Li,R.,Liu,P.,Lian,Y.,Zheng,X.,Yan,J.,etal.(2013).Single-cellRNA-Seqprofilingofhumanpreimplantationembryosandembryonicstemcells.NatStructMolBiol20,1131-1139.

Guo,H.,Zhu,P.,Yan,L.,Li,R.,Hu,B.,Lian,Y.,Yan,J.,Ren,X.,Lin,S.,Li,J.,etal.(2014).TheDNAmethylationlandscapeofhumanearlyembryos.Nature511,606-610.

Zhu,P.,Guo,H.,Ren,Y.,Hou,Y.,Dong,J.,Li,R.,Lian,Y.,Fan,X.,Hu,B.,Gao,Y.,etal.(2018).Single-cellDNAmethylomesequencingofhumanpreimplantationembryos.Naturegenetics.

人类胚胎期大脑全皮层示意图

该研究发现人类大脑皮层的区域差异性首先体现在各种类型细胞的组成比例不同,特别是神经元和胶质细胞组成比例的显著不同上。在额叶区域以兴奋性神经元为主而在颞叶区域以抑制性神经元为主,皮层下侧的脑区则主要富集神经胶质细胞,这为不同脑区神经信号网络的差异提供了细胞基础。兴奋性神经元与起源自原始神经节的抑制性神经元在发育调控上有着截然不同的特征,前者是一个连续成熟的异步分化发生过程,而后者则在发育上比较同步,同一发育时期大脑皮层中不同抑制性神经元的成熟度比较一致,异质性很小。通过对兴奋性神经元细胞发育过程的深入分析,鉴定了调控大脑皮层神经元成熟的关键候选转录因子,为体外神经元定向诱导分化提供了参考。

为了全面解析人类胚胎期神经元细胞与成体神经元细胞的基因表达差异,该研究系统分析比较了多个已经发表的单细胞转录组数据集,发现大脑皮层中的兴奋性神经元在胚胎期与成年期的基因表达差异较小,而抑制性神经元在胚胎期与成年期之间差异很大,说明抑制性神经元在胚胎发育晚期及出生后发生了更为剧烈的基因表达变化。即使胚胎-成体差异程度存在不同,这两种神经元在所研究的胚胎阶段都还不具备成体大脑皮层神经元的分层分布特征。当把所分析的所有类型的神经元细胞做聚类分析时,发现胚胎-成体阶段间的基因表达差异远大于同一发育阶段不同类型神经元细胞之间的基因表达差异,并且胚胎期兴奋性神经元与抑制性神经元之间的基因表达差异大于成年期这二者之间的差异。

兴奋性神经元分化成熟过程的调控、大脑区域成熟差异、以及胚胎期与与成体神经元的比较分析

区域细胞组成差异,区域特异基因验证及自闭症风险基因互作网络

北京大学北京未来基因诊断高精尖创新中心、生命科学学院博士后范小英、博士生董骥、中科院生物物理所博士生钟穗娟,以及北医三院博士生魏源为该研究的并列第一作者,汤富酬教授、乔杰教授及王晓群教授为共同通讯作者。该项工作得到了国家自然科学基金委、科技部、北京未来基因诊断高精尖创新中心、生命科学联合中心等的支持。

消化系统是人体中最重要的器官系统之一,而消化道作为消化系统最重要的组成部分、其在食物消化、营养吸收、废物排泄、抵抗微生物入侵等多个方面起着极其重要的作用。消化道主要由食道、胃、小肠、大肠组成。揭示这四种器官在人类胚胎发育过程中的基因表达调控网络以及“细胞类型图谱”是发育生物学的重大问题。

2018年5月25日,北京大学北京未来基因诊断高精尖创新中心、生命科学学院生物动态光学成像中心汤富酬课题组、葛颢课题组,携手北京大学第三医院乔杰课题组联合在国际知名学术期刊《NatureCellBiology》上在线发表了题为“Tracingthetemporal-spatialtranscriptomelandscapesofthehumanfetaldigestivetractusingsingle-cellRNA-sequencing”的研究论文。在国际上首次在单细胞分辨率和全转录组水平,全面、系统、深入地阐明了食道、胃、小肠和大肠这四种器官在人类胚胎发育过程中的基因表达图谱及其信号调控机制,揭示了这四种器官不同细胞类型之间的精准发育路径和基因表达特征,并进一步详细解析了大肠从胎儿到成人的发育、成熟路径和关键生物学特征。

本项研究首先分离并获取了人类6到25周胚胎中食道、胃、小肠和大肠以及成年人的大肠总计5,277个单细胞,并对其进行了高精度的单细胞转录组测序,获得了多达5T的基因表达谱数据。针对这些数据该团队结合t-SNE,KNN,PCA,Monocle2和StemID等多种生物信息学分析方法进行深度数据挖掘,全面系统地对这四种器官的发育进程在基因表达调控层面进行了深入的解析。主要发现有:

(1)通过关键基因表达特征定义了这四种器官共40种不同的重要细胞类型,其中在人类胚胎发育阶段鉴定出30种不同的细胞类型。通过对胚胎发育时期的这30种细胞类型的关键生物学特征,特别是其独特发育路径,交互信号通路网络,细胞周期分布,营养代谢状态和营养吸收特点,以及层级转录因子调控网络等特征进行了细致翔实的分析后发现,其中具有干、祖细胞特征的细胞类型有19种,并且与其它11种已经分化成熟的细胞类型相比,其在胚胎发育的较早期就已经出现并且贯穿于整个胚胎发育时期,其细胞周期也呈现出活跃分裂增殖的特点。另一方面,整体的基因表达聚类分析显示出胚胎早期消化道的四种不同器官的细胞虽然已经具有明确的空间分布差异和不同的形态特征,但是仍然具有高度相似的基因表达特点,而胚胎晚期这四种不同器官的细胞基因表达差异非常明显,显示这些细胞类型功能成熟后基因表达的高度器官特异性和细胞类型特异性。同时小肠同其它三种消化道器官相比,营养吸收代谢的关键基因在胚胎晚期被大规模同步激活,说明处于胚胎晚期的小肠可能已经具备了基本的营养吸收功能。这也说明随着胚胎发育的进行,四种器官在功能上的差异性也逐渐展现出来。

人类胚胎发育过程中食道、胃、小肠、大肠的细胞类型图谱及其关键生物学特征

(3)在消化道四种器官的发育过程中,通过解析单细胞水平上的基因表达调控网络发现,对于发育起核心调控作用的HOX家族的基因,不同的HOX基因在不同的消化道器官中可能起着关键的区域化调节作用。在Hedgehog信号通路中,IHH配体可能起到了关键作用,并且发现间充质与上皮细胞之间存在旁分泌作用,同时在小肠和大肠还发现Wnt,FGF,TGF-β和BMP等信号通路协同调控着它们的发育过程。

人类胚胎发育过程中小肠的信号通路等调控模式示意图

(4)针对大肠的发育进程,该研究进一步获取了成年人大肠高精度的单细胞转录组数据,首次系统地研究了大肠从胎儿到成人的发育过程,成年人大肠中10种主要的细胞类型都被精确地鉴定出来。该研究系统地揭示了包括大肠干、祖细胞,肠上皮细胞,杯状细胞等功能成熟的细胞类型的核心基因表达模式和关键标志基因等重要生物学特征。在胎儿发育的后期,大肠中的细胞类型以及其基因表达模式与成年人阶段已经很接近,其中一些特定细胞类型的关键基因的表达也都趋于一致,说明在胚胎晚期大肠的主要细胞类型可能已经具备了初步的食物消化和营养吸收功能。

成年人大肠中的细胞类型(左图)及大肠从胚胎时期到成年人阶段的发育路径(右图)

THE END
1.数据挖掘概念(AnalysisServices有关如何将 SQL Server 工具应用于业务方案的示例,请参阅数据挖掘基础教程。 定义问题 与以下关系图的突出显示相同,数据挖掘过程的第一步就是明确定义业务问题,并考虑解答该问题的方法。 该步骤包括分析业务需求,定义问题的范围,定义计算模型所使用的度量,以及定义数据挖掘项目的特定目标。这些任务转换为下列问题: https://technet.microsoft.com/zh-cn/library/ms174949(en-us,sql.105).aspx
2.具备安全态势感知能力的安全管理平台厂商动态图:态势感知核心过程示意图 它通过态势要素获取,获得必要的数据,然后通过数据分析进行态势理解,进而实现对未来短期时间内的态势预测。注意,态势感知最终达成的目标是实现对未来的短期预测,是一个动态、准实时系统。 1.2 安全态势感知 在上个世纪末90年代,态势感知才被引入到信息技术安全领域,并首先用于对下一代入侵检测https://news.zol.com.cn/149/1490562.html
3.zfcg.fuzhou.gov.cn/upload/document/20210531/a2f60d92e4d649a9计算资源管理调度功能示意图 计算资源管理调度模块不仅对GPU计算资源设备进行管理与调度,对GPU容器云平台进行管理与调度,而且对不同算法仓库体系模式的分析集群进行统一管理。 功能设 计 针对独立分析集群,计算资源管理调度模块主要实现嵌入式架构GPU服务器、通用X86架构GPU服务器的运行状态管理,以及按照单台或多台的方式添http://zfcg.fuzhou.gov.cn/upload/document/20210531/a2f60d92e4d649a9bd2b904312f583f0.html
4.编程数学之图形可视化分析白宁超的官网通过揭示数据背后的规律和隐藏信息,给相关角色提供参照价值,做出相应的决策。这在数据挖掘、自然语言处理、机器学习都广泛应用。本文主要介绍常见的图形可视化的概念和使用,使读者最短时间掌握基本的统计知识。(本文原创,转载必须注明出处.) 饼图 定义 饼图广泛得应用在各个领域,用于表示不同分类的占比情况,通过弧度https://bainingchao.github.io/2018/10/10/%E7%BC%96%E7%A8%8B%E6%95%B0%E5%AD%A6%E4%B9%8B%E5%9B%BE%E5%BD%A2%E5%8F%AF%E8%A7%86%E5%8C%96%E5%88%86%E6%9E%90/
5.《2020科技趋势报告》:AI和中国,成为未来科技世界关键词程序员使用特殊的深度学习算法,同时使用大量的数据,通常是数兆字节的文本、图像、视频、语音等,系统被训练成独立学习。虽然概念上的深度学习并不是什么新鲜事,但最近发生的变化是计算量和可用的数据量。实际上,这意味着越来越多的人工过程将被自动化,包括软件的编写,计算机很快就会开始自己编写。 https://www.tmtpost.com/4274113.html
6.HTTP/2协议HPACK(HTTP2头部压缩)原理介绍1.3 HEADER 压缩编码示意图 Tips:'Huffman'算法是一种压缩算法。 1.4 HEADER 压缩编码示意图 动态表可以简单理解为在请求过程中映射的索引表,比如第一个请求帧(frame)使用静态表+Huffman算法构成的索引表(静态表+动态表)可以在下一次请求帧(frame)中只需要传递新增的内容使用Huffman算法,不变的内容可以使用索引表中https://developer.aliyun.com/article/1343532
7.生物材料双向拉伸试验知识科普图7 心包内注射机械-电耦合水凝胶贴片用于心肌修复示意图[40] 除上述方法外,3D工程心血管组织在替换受损结构方面显示出巨大的前景。具体地说,组织工程血管移植物具有取代生物和合成移植物的潜力。Mayoral等通过3D打印、混合熔融沉积建模、静电纺丝技术和干细胞接种制作了一种组织工程化体外血管贴片(见图8),用于评价3Dhttp://www.tjcaremc.com/Article-3400021.html
8.大厂技术实现详解知识图谱的构建全流程@自然语言处理系列自底向上构建:借助一定的技术手段,从公开采集的数据中提取出资源模式,选择其中置信度较高的信息,加入到知识库中。 知识图谱的构建 | 自顶向下→自底向上; 6-3 1.3 “实体-关系-实体”三元组 下图是典型的知识图谱样例示意图。可以看到,“图谱”中有很多节点,如果两个节点之间存在关系,他们就会被一条无向边连接https://cloud.tencent.com/developer/article/1938296
9.技术揭秘互联网广告黑产盛行,如何反作弊?机器作弊[1]成本低,特征集中,容易识别;人工作弊成本高,作弊者要想获利也会表现会一定的集中性,需要深入分析数据挖掘异常特征,从而识别作弊。 三 广告点击反作弊核心问题 世界广告主联盟WFA表示[1]“若不采取措施,2025 年虚假广告花费将高达 500 亿美元,仅次于毒品交易金额,成为世界第二大非法营收https://www.51cto.com/article/635445.html
10.数字孪生数字孪生系列报道:15家单位22位作者研究成果,数字数据融合是指在实现车间物理融合与模型融合基础上,基于车间运行一致性原理,对物理车间现场实时数据、虚拟车间模型数据、仿真数据、车间服务系统数据等覆盖全要素、全流程、全业务的相关数据进行生成—建模—清洗—关联—聚类—挖掘—迭代—演化—融合等操作,有效真实刻画和反映车间运行状态、要素行为等各类动态演化过程、https://www.zhuanzhi.ai/document/d63863c6849a79c6a6f25d51bb522554
11.《暗黑地牢》全地图各道具使用效果一览表(2)检查GPS上的采集信息后,把GPS连接至计算机进行数据导入,但连接前一定要关闭GPS电源再连接。 电子地图如何制作简介 电子地图如何制作简介 下列为电子地图的制作过程 1.准备纸的地图如:交通旅游图、测绘局购买的图等你想做的图。 2.把准备的地图扫描进计算机 3.下载地图矢量化软件mapinfo professional,autoCAD等也https://m.360docs.net/doc/fa2328e24bfe04a1b0717fd5360cba1aa8118c2f.html
12.艺术档案数字化民间艺术的数字化涉及信息的采集、处理和储存,这其中包含采集设备的选择、数据处理方式、储存格式和数据库技术。但是截止到目前,并没有一个全国统一的数据加工规范或标准,无论在民间艺术普查阶段还是在名录项目申过程中,都不同程度存在一些问题,具体表现在:数据资料保存很好,但标示和描述很差,以至于使潜在的用户无法了解https://www.zboao.com/cgal/8068.html
13.科学网—[转载]人工智能时代的数据隐私垄断与公平图2 数据透明对隐私、垄断和公平问题的促进作用示意图 在大数据透明的具体实现上,政府机构和研究者们分别从政策和技术上做出诸多努力和探索。政策上,GDPR等法律法规的出台,明确规定了数据主体(即用户)对数据的控制权,以保证个人数据在其数据生命周期中具有更高的透明度,数据主体对个人数据具有更强的管控能力;技术上,https://blog.sciencenet.cn/blog-3472670-1289492.html
14.2020年媒体技术趋势报告:13大领域89项变革全输出德克萨斯大学阿灵顿分校和谷歌的研究人员一直在研究使用框架语义的自动化技术。框架是描述了特定类型事件、情况、对象或关系及其参与者的示意图。研究人员扩展了一个名为FrameNet的系统用来专门为包括自动事实核查在内的功能构建新框架。 在屏事实核查 (On-Screen Fact Checking) https://36kr.com/p/5267903
15.机器学习实战——LBP特征提取在上面的实验中,由于数据图只有2020,单元尺寸为4时,单元个数只有25个,所以在等价旋转不变LBP算法中,特征维度只有925,等价模式本来为了降维而生,但是本身就不高的维度降维后,丢失了很多特征信息,这可能是LBP(9)只有86.7%的准确率的重要原因。总结一下,上面的实验结果只是一个很简单的验证,并不能说明LBP(9)算法不https://www.jianshu.com/p/8d96ceb45f74