浙江白癜风QQ交流群 http://www.guanxxg.com/news/roll/1569098.html撰文
十一月
心脏的器官发生开始于两个不同中胚层细胞组细胞,分别是初级生心区(Primaryheartfield,PHF)以及次级生心区(Secondaryheartfield,SHF)。这两种不同的中胚层谱系产生三种不同的心脏细胞亚型,分别是心肌细胞、心外膜细胞以及心内膜细胞,这些细胞后来与神经嵴的细胞整合最终形成功能正常的人类心脏。
先前对发育中的人类心脏的单细胞转录组进行的研究极大地增强了对于心脏发生过程中细胞类型以及基因调控的理解。然而,在人类心脏发育的分化轨迹中,缺乏细胞类型解析的基因表达程序顺式和反式调控元件的综合性资源。先天性心脏病(Congenitalheartdisease,CHD)是最常见的发育性出生缺陷,每年影响1%的新生儿,但是只有8%的患者病因是由于蛋白质编码基因区域的突变。这说明解析基因表达的调控元件将会很大程度上帮助揭开先天性行脏病的病因。
近日,美国斯坦福大学AnshulKundaje研究组、WilliamGreenleaf研究组、ThomasQuertermous研究组以及KevinC.Wang研究组合作在Cell上发表了文章Integrativesingle-cellanalysisofcardiogenesisidentifiesdevelopmentaltrajectoriesandnon-codingmutationsincongenitalheartdisease,建立了发育中的人类心脏的细胞类型解析调控图谱,揭示了心脏发生中的细胞分化轨迹和先天性心脏病中非编码遗传变异的参与。
为了建立人类心脏发育过程中基因调控元件图谱,作者们使用Chromium10x基因组平台对受孕后6周、8周以及19周的人类胎儿样本进行了染色质可及性分析,获得了单细胞数据联合图谱。作者们总共获得了30,个经过过滤和质量控制的高质量scATAC-seq细胞条码,并使用Leiden聚类算法来发现和优化可能对应于不同细胞类型的细胞簇。之后作者们通过先前发表的不同发育时间点的scRNA-seq数据进行对比,证明了所得到scATAC-seq图谱与先前的数据非常匹配。
随后作者们训练了卷积神经网络,可以从DNA序列中预测细胞类型解析染色质可及性,从而破译顺式调控元件上不同转录因子组合的结合动态基序数据库。作者们使用最优传输算法确定了心脏发生过程中8个主要的分化轨迹,定义了促进心脏初级细胞类型形成的转录因子活动的持续进展。
利用这一代表体内心脏发育的细胞状态图谱,作者们比较了由诱导多能干细胞衍生的主要心脏细胞类型组成的常见体外细胞模型系统的染色质可及性景观。基于体外和体内心外膜细胞的比较,作者们优化了诱导多能干细胞来源的心外膜细胞的分化方案,从而促使该体外分化的心外膜细胞具有与体内基因组表现出更大的相似性。
最后,作者们使用该深度学习模型对先天性心脏病中非编码突变进行了优先级排序,通过破坏转录因子结合位点对推定的顺式调控元件在不同细胞类型特异性染色质可及性的影响进行预测。另外,作者们在体外分化内皮细胞中进行了基于CRISPR的增强子敲除实验验证细胞类型特异性增强子的调控影响,这一增强子被预测会导致一种有害的先天性心脏病突变,改变关键发育的表达。
图1工作模型
总的来说,作者们所建立这一数据库和预测模型共同定义了人类心脏在妊娠中期发育轨迹的顺式和反式基因调控元件格局,并提供了一个深度学习框架,可以特定地指定候选顺式调控元件中的非编码新生突变并预测先天性心脏病中相关的转录因子结合和染色质可及性状态。这一图谱为理解心脏发生过程以及先天性心脏病的发生机理提供了新的全局性工具。
原文链接: