人工智能检测到自闭症背后的新突变

科技 2021-10-14 08:30:21
导读 大家好,我是本栏目的编辑郝帅。现在我想向大家解释一下,导致这种疾病的DNA中的许多突变并不在实际的基因中,而是在99%被认为是“垃圾”的

大家好,我是本栏目的编辑郝帅。现在我想向大家解释一下,导致这种疾病的DNA中的许多突变并不在实际的基因中,而是在99%被认为是“垃圾”的基因组中。尽管科学家们最近已经了解到这些巨大的DNA片段确实发挥了关键作用,但到目前为止,还不可能大规模破译这些影响。

普林斯顿大学领导的团队利用人工智能解释了这种突变对自闭症患者的功能影响。研究人员认为,这种强有力的方法通常适用于发现任何疾病的遗传贡献。

普林斯顿大学计算机科学和基因组学教授奥尔加特罗扬斯卡娅(Olga Troyanskaya)领导的这项研究开发了一种新方法,用于搜索影响整个人类基因组基因调控方式的突变,并预测这些突变如何与自闭症等疾病相关联。自闭症患者中预测被调控突变破坏的基因往往参与脑细胞功能,分为两类。一个(以蓝色显示)涉及神经元之间的突触和通讯中枢,另一个(以红色显示)涉及染色质,染色质是染色体中基因正确表达所需的高度结构化的DNA和蛋白质形式。研究人员的插图。

发表在《自然遗传学》杂志上,研究人员分析了1790个家庭的基因组,其中一个孩子患有自闭症谱系障碍,但其他成员没有。这种方法对12万个突变进行分类,找出那些影响自闭症患者基因行为的突变。尽管这些结果没有揭示自闭症病例的确切原因,但它们揭示了研究人员对这项研究的数千个可能贡献者。

以前的许多研究都集中在识别基因本身的突变上。基因本质上是制造、构建和控制身体的许多蛋白质的描述。基因突变导致蛋白质突变,其功能被破坏。然而,其他类型的突变会破坏基因的调节方式。这些区域的突变不会影响基因的产生,但会在什么时候产生,产生多少基因。

研究人员表示,到目前为止,还不可能在整个基因组中找到调控基因的DNA片段,也无法预测调控DNA中的这种突变可能如何导致复杂的疾病。这项研究首次证明了调节性DNA突变会导致复杂的疾病。

“这种方法为分析任何疾病提供了一个框架,”该研究的资深作者、计算机科学和基因组学教授奥尔加特罗扬斯卡娅(Olga Troyanskaya)说。这种方法可能对神经系统疾病、癌症、心脏病和许多其他无法确定遗传原因的疾病特别有帮助。

“这改变了我们需要思考这些疾病的可能原因的方式,”Troyanskaya说,她也是纽约西蒙斯基金会铁研究所基因组学副主任,领导了一组作者。

该团队还包括一个由洛克菲勒大学神经科学家罗伯特达内尔领导的小组。这篇论文的第一作者是周健和克里斯托弗帕克,他们获得了普林斯顿大学的博士学位。现在他们正在拜访刘易斯-西格勒综合基因组研究所的合作者和弗拉铁研究所的研究人员,以及普林斯顿刘易斯-西格勒研究所的钱德拉希菲尔德。用于整合基因组学。

以前大多数关于疾病遗传基础的研究都集中在20,000个已知基因和调控这些基因的DNA周围部分。然而,即使是大量的遗传信息也只占人类基因组中32亿个化学对的1%多一点。其他99%传统上被认为是“黑暗”或“垃圾”,尽管最近的研究已经开始摧毁这一想法。

在他们的新发现中,研究小组提供了一种理解大量基因组数据的方法。该系统使用一种被称为深度学习的人工智能技术,在这种技术中,算法执行连续的分析层来理解原本无法区分的模式。在这种情况下,该算法自学如何识别DNA的生物相关部分,并预测这些片段是否在已知影响基因调控的2000多种蛋白质相互作用中发挥作用。该系统还预测破坏单对脱氧核糖核酸单元是否会对这些蛋白质相互作用产生实质性影响。

Troyanskaya说,该算法“沿着基因组滑动”,并分析其周围的1000个化学对中的每一个,直到扫描所有突变。因此,该系统可以预测整个基因组中每个化学单位的突变效果。最后,它揭示了可能调节基因的DNA序列和可能干扰这种调节的突变的优先列表。

在这种计算之前,收集这种信息的传统方法是对每个序列和序列中每一个可能的突变进行艰苦的实验室实验。这些可能的功能和突变的数量太多,无法考虑——实验方法需要对每个突变进行2000多种类型的蛋白质相互作用的测试,并在组织和细胞类型中重复这些实验,总计数亿次实验。其他研究小组试图通过将机器学习应用于脱氧核糖核酸的目标部分来加速这一发现,但未能意识到观察每一个脱氧核糖核酸单元和每一个可能的突变的能力,以及对整个基因组中2000多个调节相互作用的影响。

帕克说:“我们的论文真正允许你做的是把所有这些可能性进行排序。“优先化本身非常有用,因为现在你也可以继续尝试最高优先级。”

最后,系统根据已知的致病突变校准其预测,并制定“疾病影响评分”,以评估给定突变对疾病产生影响的可能性。

研究人员分析了自闭症的情况。

了1790个具有“单纯性”孤独症谱系障碍的家庭的基因组,这意味着该病症在一个孩子中是明显的,但在其他家庭成员中则不然。(这些数据来自2000多个孤独症家庭的Simons Simplex Collection。)在这个样本中,受自闭症谱系障碍影响的人中只有不到30%具有先前确定的遗传原因。研究人员表示,新发现的突变可能会显着增加这一比例。

预测每个突变的功能效应的能力是这项新研究的关键创新。之前的研究发现,与未受影响的人相比,检测自闭症患者的调节突变数量存在任何差异具有挑战性。然而,新方法研究了预测具有高功能影响的突变,发现受影响人群中此类突变的数量明显增多。

当研究人员随后查看哪些基因受这些突变影响时,他们发现它们是与大脑功能密切相关的基因。这些新发现的突变影响了与先前鉴定的突变相似的基因和功能。

“现在我们打开这个领域,了解可能与自闭症有关的所有因素,”Theesfeld说。

这些信息对于家庭及其医生来说也很重要,可以更好地诊断这种疾病,并避免过分笼统地假设一个人的孤独症如何与其他人分类。“他们说,当你遇到一个患有自闭症的人时,你遇到了一个患有自闭症的人,因为没有相同的病例,”Theesfeld说。“基因上,它似乎是一样的。”

通过这种新方法,该团队正在分析各种形式的癌症,心脏病和其他疾病的遗传原因。

郑重声明:本文版权归原作者所有,转载文章仅为传播更多信息之目的,如作者信息标记有误,请第一时候联系我们修改或删除,多谢

最新文章