人工智能的隐形敌人:面对数字“暗物质”的挑战

发布号 7 2025-09-11 16:51:50

多余的无关信息或“噪音”一直在掩盖人工智能分析DNA的关键特征,这个问题被比作遇到数字“暗物质”。现在,科学家们可能有办法解决这个问题。

人工智能已经渗透到我们的日常生活中。最初,它在ChatGPT中很明显,目前,它在人工智能生成的披萨和啤酒广告中也很明显。虽然人工智能可能不完全可靠,但有时,我们对人工智能的处理似乎也不完全值得信赖。

冷泉港实验室(CSHL)助理教授古永乐(Peter Koo)发现,科学家们使用流行的计算工具来解释人工智能预测,在分析DNA时,会接收到太多的“噪音”或额外的信息。他找到了解决办法。现在,只需要几行新的代码,科学家就可以从被称为深度神经网络的强大人工智能中获得更可靠的解释。这意味着他们可以继续寻找真正的DNA特征。这些特征可能预示着健康和医学领域的下一个突破。但如果信号被太多的噪音淹没,科学家就看不到信号了。

那么,是什么引起了这些烦人的噪音呢?它是一种神秘而无形的来源,就像数字“暗物质”一样。物理学家和天文学家认为,宇宙的大部分都充满了暗物质,这种物质会产生引力效应,但迄今为止还没有人发现过。同样,Koo和他的团队发现,人工智能正在接受训练的数据缺乏关键信息,导致严重的盲点。更糟糕的是,在解释人工智能对DNA功能的预测时,这些盲点会被考虑在内。

Koo说:“深度神经网络正在整合这种随机行为,因为它在任何地方都学习一个函数。但DNA只是其中的一个子空间。它带来了很多噪音。因此,我们表明,这个问题实际上确实在各种著名的人工智能模型中引入了很多噪音。”

数字暗物质是科学家借鉴计算机视觉人工智能的计算技术的结果。与图像不同,DNA数据仅限于四个核苷酸字母的组合:a, C, G, t。但是以像素为形式的图像数据可以是长而连续的。换句话说,我们给ai提供了一个它不知道如何正确处理的输入。

通过应用Koo的计算校正,科学家可以更准确地解释人工智能的DNA分析。

Koo表示:“我们最终看到网站变得更加清晰和干净,其他地区的虚假噪音也减少了。被认为非常重要的一次性核苷酸突然消失了。”

辜永明认为,噪音干扰影响的不仅仅是人工智能DNA分析仪。他认为,在涉及类似类型数据的计算过程中,这是一种普遍的痛苦。记住,暗物质无处不在。值得庆幸的是,Koo的新工具可以帮助科学家们走出黑暗,走向光明。

参考文献:Antonio Majdandzic, Chandana Rajesh和Peter K. Koo, 2023年5月9日,Genome Biology,“校正基于梯度的深度神经网络基因组学解释”。DOI: 10.1186 / s13059 - 023 - 02956 - 3

这项研究由美国国立卫生研究院和西蒙斯定量生物学中心资助。

上一篇:长春疫情新增的是哪的/长春新增病例分布
下一篇:北京市新增疫情通报名单:北京市新冠疫情动态
相关文章

 发表评论

暂时没有评论,来抢沙发吧~