澎湃Logo
下载客户端

登录

  • +1

生命科学“登月计划”再进一步,MIT绘制迄今最全面人类表观基因组综合图谱

2021-02-07 17:50
来源:澎湃新闻·澎湃号·湃客
字号

原创 转网 转化医学网 收录于话题#最新研究213个

本文为转化医学网原创,转载请注明出处

作者:Cathy

导言:二十年前,人类基因组图谱首次被公布。这个被誉为生命科学“登月计划”的项目为人类揭开自身奥秘奠定了坚实的基础。该项目的惊人发现之一就是,人的基因组中仅有1.5%的序列是负责蛋白质编码的,其余的98.5%的序列可能都是“垃圾”。

然而很明显,越来越多的证据表明,那些最初被认为是“垃圾DNA”的非编码DNA片段在发育和基因调控中起着至关重要的作用。

近日,在一项新研究中,麻省理工学院的一组研究人员公布了这种非编码DNA的最全面的图谱,并于2021年2月3日发表于国际顶级期刊Nature杂志。

这项题为“Regulatory genomic circuitry of human disease loci by integrative epigenomics”的研究提供了对表观基因组标记的深入注释,涵盖了833个组织和细胞类型,比以前涵盖的范围有了显著的增加。研究人员还确定了控制特定生物程序的调控元件组,他们发现了与540个特定性状相关的约30000种遗传变异的潜在作用机制。

该研究的通讯作者,麻省理工学院计算机科学与人工智能实验室兼麻省理工学院和哈佛大学博得研究所的成员,计算机科学教授Manolis Kellis说:“我们所提供的实际上是人类基因组的整个电路。经过了20年,我们不仅可以提供基因注释,还具有非编码注释,同时还具有了模块、上游调节器、下游靶标、致病突变,以及对这些致病突变的解释。”此外,研究人员已将其所有数据公开提供给更广泛的科学界使用。

表观遗传调控

表观基因组位于人类基因组的顶层(构成遗传密码的核苷酸序列)之上。表观基因组包含许多化学标记,可帮助确定哪些基因在什么时间和什么细胞中表达。这些标记包括组蛋白修饰、DNA甲基化以及特定DNA片段的螺旋化程度。

Kellis说:“表观基因组学直接读取了我们细胞所使用的标记,以记住在每种细胞类型以及我们身体的每个组织中开启和关闭的内容。它们充当便利贴、荧光笔和下划线的功能。表观基因组学使我们可以窥视在每种细胞类型的每个细胞中,那些被标记为重要的分子,从而了解基因组的实际功能。”

绘制这些表观基因组注释可以揭示遗传控制元件,以及元件活跃的细胞类型。这些控制元件可以组合成簇或模块,这些簇或模块一起起作用以控制特定的生物功能。这些元素中的一些是增强子,与激活基因表达的蛋白质结合,而另一些则是关闭基因的终止子。

新的图谱EpiMap(多注释项目的表观基因组整合)建立在多个大规模图谱联盟的数据基础上(包括ENCODE、NIH Roadmap Epigenomics和Genomics of Gene Regulation)。

EpiMap资源概述

研究人员总共收集了833个生物样本,代表了不同的组织和细胞类型,每个样本都有一个稍有不同的表观基因组标记,因此很难完全整合多个联合体的数据。随后,他们将相似标记和生物样本的可用数据结合起来,填写了缺失的数据集,并使用833个生物样本的10000个标记的结果概要来研究基因调控和人类疾病。

研究人员注释了超过200万个增强子位点,仅覆盖每个生物样品的0.8%,总共覆盖了基因组的13%。他们根据活动模式将它们分为300个模块,并将它们与它们控制的生物过程、控制它们的调控因子以及介导这种控制的短序列联系起来。研究人员还预测了330万个控制元件和它们所针对的基因之间的联系,这是基于它们的协同活动模式,代表了迄今为止人类基因组中最完整的电路。

与疾病的联系

自人类基因组的最终草图于2003年完成以来,研究人员已经进行了数千项全基因组关联研究(GWAS),揭示了一些使携带者易患特定性状或疾病的常见基因突变。

这些研究已经发现了大约12万个突变,但其中只有7%位于蛋白质编码基因内,剩下93%位于非编码DNA区域。

然而,由于许多原因,非编码突变如何起作用是极难解释的。首先,基因突变是成块遗传的,因此很难在每个疾病相关区域的数十个突变中找出致病突变。此外,非编码突变可以在很远的距离内起作用,有时甚至在数百万个核苷酸之外,因此很难找到它们的靶基因。它们还具有极强的动态性,很难知道它们在哪个组织中起作用。此外,了解其上游调节器也仍然是一个未解决的问题。

在这项研究中,研究人员能够解决这些问题,并为30000多个非编码GWAS突变提供潜在机制的见解。研究人员发现,与同一性状相关的突变倾向于在与该性状生物学相关的特定组织中富集。例如,与智力相关的基因突变存在于大脑活动的非编码区域,而与胆固醇水平相关的变异则存在于肝脏活动的区域。

研究人员还表明,某些性状或疾病会受到在许多不同组织类型中活跃的增强子的影响。例如,他们发现与冠心病(CAD)相关的遗传变异在脂肪组织、冠状动脉和肝脏等许多组织中都很活跃。

目前,Kellis的实验室现在正与不同的机构合作,在这些全基因组预测的指导下,寻找他们在特定疾病中的线索。他们正在分析冠心病患者的心脏组织、阿尔茨海默氏症患者的小胶质细胞、以及肥胖患者的肌肉、脂肪和血液,这些都是基于当前论文和他实验室先前工作的预测。

许多其他实验室已经在使用EpiMap数据来研究各种疾病。研究人员希望这项成功能在工业界和学术界得到广泛应用,帮助阐明基因变异及其作用机制,为靶向治疗找到最有希望的靶点,并加速许多疾病的药物开发。

参考资料:

【1】https://medicalxpress.com/news/2021-02-epigenomic-reveals-circuitry-human-disease.html

【2】https://www.nature.com/articles/s41586-020-03145-z

今日视频内容推荐

《走进安亭国际医疗产业园》第一期,聚孵(上海)企业管理咨询有限公司 董事长 张炯 博士:与时代同步,加入更多互联网思维,从企业群体的角度,重新审视园区管理和服务工作新的内容和方向!

原标题:《【Nature】生命科学“登月计划”再进一步!MIT绘制迄今最全面人类表观基因组综合图谱!》

阅读原文

    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问http://renzheng.thepaper.cn。

    +1
    收藏
    我要举报
            查看更多

            扫码下载澎湃新闻客户端

            沪ICP备14003370号

            沪公网安备31010602000299号

            互联网新闻信息服务许可证:31120170006

            增值电信业务经营许可证:沪B2-2017116

            © 2014-2024 上海东方报业有限公司

            反馈