新华社伦敦(郭爽)1月29日,谷歌旗下Deep Thinking公司在英国《自然》杂志上发表封面故事。该公司宣布的“Alpha Genome”深度学习模型可以破译人类基因组中98%的“黑暗基因组”,这对健康至关重要。未来,它可以用于更好地了解遗传疾病,改进基因检测,并为新疗法的开发提供信息。人类基因组由大约30亿个DNA碱基对组成,DNA的双螺旋结构由A、T、C、G四个碱基有序排列组成。其中,只有约2%的基因负责蛋白质编码,约98%的区域是非编码区域。这些区域通常被称为“黑暗基因组”,尽管它们不直接编码蛋白质,但它们可以影响基因表达。这些非编码区含有大量与疾病相关的突变位点,但人们对此并不清楚受到科学界的好评。传统方法通常需要在序列长度和预测精度之间进行权衡。 AlphaGenome模型打破了这一技术瓶颈,实现了长DNA序列的高分辨率预测。该模型使用人类和小鼠基因组进行训练,以了解 DNA 序列如何影响各种生物过程。研究表明,AlphaGenome模型可以预测多达100万个碱基对的DNA序列的功能。这个工具不仅可以预测基因的位置,还可以预测“黑暗基因组”对基因表达和剪接的影响。令人惊讶的是,该模型可以预测遗传密码中单个“字母”(单个碱基)变化的影响。研究团队通过 26 个基准测试对 AlphaGenome 模型进行了综合评估,结果表明该模型在 25 项任务上达到或超过了现有最先进模型的水平。该公司Deep Thinking团队在社交上表示媒体当天表示,该工具将帮助研究人员了解 DNA、预测遗传变化的分子效应并加速新的生物发现。 AlphaGenome 模型该工具于去年发布用于非商业用途,此后已被 3,000 名科学家使用。开发该模型的研究团队表示,它并不完美,但一些研究人员将其描述为“非凡的成就”和“重要的里程碑”。
(编辑:马长彦)
每日更新