新的计算机程序“学习”识别导致疾病的马赛克突变
基因突变会导致数百种无法治愈的疾病。其中,一小部分细胞中的DNA突变被称为马赛克突变,因为它们存在于很小比例的细胞中,所以非常难以检测到。
目前的DNA突变软件探测器在扫描人类基因组的30亿个碱基时,并不能很好地识别隐藏在正常DNA序列中的镶嵌突变。通常,医学遗传学家必须用眼睛检查DNA序列,以试图识别或确认马赛克突变——这是一项耗时的工作,充满了错误的可能性。
这篇文章发表在2023年1月2日的自然生物技术,加州大学圣地亚哥分校医学院和雷迪儿童基因组医学研究所的研究人员描述了一种教计算机如何使用被称为“深度学习”的人工智能方法来发现马赛克突变的方法。
深度学习有时被称为人工神经网络,是一种机器学习技术,它教会计算机做人类与生俱来的事情:以身作则,特别是从大量信息中学习。与传统的统计模型相比,深度学习模型使用人工神经网络来处理视觉表示的数据。这些模型的功能类似于人类的视觉处理,具有更高的准确性和对细节的关注,从而在计算能力方面取得了重大进展,包括突变检测。
“一个未解决的疾病的例子是局灶性癫痫,”资深研究作者约瑟夫·格里森医学博士说,他是加州大学圣地亚哥分校医学院神经科学Rady教授,Rady儿童基因组医学研究所神经科学研究主任。
“癫痫影响着4%的人口,约四分之一的局灶性癫痫发作对普通药物没有反应。这些患者通常需要手术切除短路的脑灶部分以阻止癫痫发作。在这些患者中,大脑内的马赛克突变可引起癫痫灶。
“我们有很多癫痫患者,我们无法发现病因,但一旦我们将我们称为‘深度马赛克’的方法应用于基因组数据,突变就变得明显了。这使我们能够提高某些形式癫痫的DNA测序的敏感性,并导致了一些发现,为治疗脑部疾病指明了新方法。”
格里森说,精确检测马赛克突变是医学研究开发许多疾病治疗方法的第一步。
Gleeson实验室的博士后学者Yang Xiaoxu博士说,DeepMosaic在整个基因组中接受了近20万个模拟和生物变异的训练,直到“最终,我们对它从从未遇到过的数据中检测变异的能力感到满意。”
为了训练计算机,作者提供了可靠的马赛克突变示例以及许多正常的DNA序列,并教计算机分辨其中的差异。通过对越来越复杂的数据集进行反复训练和再训练,并在十几个模型之间进行选择,计算机最终能够比人眼和以前的方法更好地识别马赛克突变。DeepMosaic还在几个从未见过的独立大规模测序数据集上进行了测试,表现优于先前的方法。
“DeepMosaic在从基因组和外显子序列中检测镶嵌性方面超越了传统工具,”共同第一作者徐昕说,他曾是加州大学圣地亚哥医学院的本科生研究助理,现在是诺华公司的研究数据科学家。“深度学习模型捕捉到的突出视觉特征与专家在手动检查变量时关注的内容非常相似。”
DeepMosaic对科学家免费开放。研究人员说,这不是一个单一的计算机程序,而是一个开源平台,可以让其他研究人员训练自己的神经网络,使用类似的基于图像的设置来实现更有针对性的突变检测。
- 上一篇
危险:嗅觉破坏、病毒炎症与阿尔茨海默病的加速发病有关
CU Anschutz的研究人员怀疑病毒会破坏嗅觉神经,进而影响控制记忆和学习的海马体。根据科罗拉多大学安舒茨医学院研究人员的一项新研究,病毒可以引发炎症并破坏控制嗅觉的嗅觉系统与大脑中与记忆和学习有关的部分之间的联系,可能会加速阿尔茨海默病的发作。 这一发现发表在12月13日的《衰老神经生物学》杂志上,可能会
- 下一篇
改变神经元的内在行为
来自哈佛大学约翰·保尔森工程与应用科学学院(SEAS)和麻省理工学院的研究人员开发了一种新方法,可以针对大脑中患病的神经元,并利用光改变它们的长期行为,为癫痫和自闭症等神经系统疾病的潜在新疗法铺平了道路。这项研究发表在《科学进展》杂志上。“我们设想,这项技术将为神经科学和行为研究的神经元的高时空分辨率控制提供新的机会,并为神经疾病开发新的治疗方法,”生物工程