以猿类DNA为基础训练的AI可以预测人类的遗传疾病风险

2023年06月05日 由 daydream 发表 737825 0
一组国际研究人员利用一种新颖的 AI 算法分析灵长类 DNA 数据,进一步揭示了导致人类疾病的基因变异。

最初,科学家对所有 16 个家族的非人类灵长类,从狐猴到大猩猩中的 233 种物种,进行了 800 多个个体样本的测序。为了解释这些数据,他们开发了一个新的算法:PrimateAI-3D。

PrimateAI-3D建立在与ChatGPT类似的深度学习语言架构上,但旨在模拟基因组序列而不是语言序列。研究小组利用自然选择来训练它的参数,通过向它展示一些突变,这些突变在我们的灵长类亲戚中被排除了疾病。通过这种方式,算法学会了识别良性的基因变异,并通过消除过程,识别可能导致疾病的突变。

然后,科学家应用 PrimateAI-3D,利用英国生物库计划中400多人的健康记录和基因变异数据,识别人类的潜在有害突变。他们发现,该算法在预测人类常见疾病的遗传风险方面具有"显著改进"。

该方法声称比现有技术更准确地识别致病突变,这也与其能克服源自白人欧洲祖先的遗传偏见有关。



该研究的合著者、合作公司Illumina的人工智能副总裁Kyle Farh说:“尽管我们有80亿人,但我们的基因多样性看起来仍然像10000个共同祖先的原始种群。”

他补充说:"从几年前开始就清楚了,想要真正了解人类基因组,人类基因组测序内所包含信息是不够的。"

结合人类和非人灵长类的数据对于此非常关键,尤其是因为灵长类之间的共享 DNA 高达90%以上。Illumina的研究表明,如果某种基因变异在另一种灵长类的自然选择中被耐受,那么它在人类中99%不太可能导致疾病。

该研究的发现可用于支持健康研究,例如帮助科学家优先考虑最有可能对人类构成风险的变体。它们也可帮助保护其他猴类的种群。

“我认为我们还只是刚刚开始,”Farh表示。"这里有大量可以学习的内容,从其他物种中了解我们自己的物种的想法,我认为是非常浪漫的。"

完整的研究发表在《Science》杂志上。

 

来源:https://thenextweb.com/news/ai-trained-on-ape-dna-predicts-genetic-disease-risks-humans
欢迎关注ATYUN官方公众号
商务合作及内容投稿请联系邮箱:bd@atyun.com
评论 登录
热门职位
Maluuba
20000~40000/月
Cisco
25000~30000/月 深圳市
PilotAILabs
30000~60000/年 深圳市
写评论取消
回复取消