“人工智能改变了很多科学发现背后非常重要的逻辑,数据的意义也正在发生深刻变化。”中国工程院院士、之江实验室主任、阿里云创始人王坚早前表示,如何用AI打造更加开放的科学研究过程,是一个全球面临的挑战。
王坚指出,2024年11月发表在美国天文学会会刊上面的一篇文章,作者发现确认了150万个未知的天体。这样规模的发现,过去应该是一个几百人团队署名的文章,但这篇文章只有一个作者,而且是一个18岁的高中生。“这篇论文所有依据的数据不是新的数据,是一个NASA已经退役的巡天探测器留下来的数据。所以我们过去对数据的理解、数据产权的界定、数据价值的界定,在科学发现阶段,都要做一次重新的思考。”
王坚指出,当谈到“数据”对科学技术影响的时候,这个“数据”已经远远超出了大家讲的出版物的数据,已经远远超出了大语言模型,今天可能在语言文字上,还有很多知识产权的问题没有明确,但将来的问题会变得更加挑战更加复杂。“科学发现不只是从语言和图片,事实上最后都要回到最原始的科学数据观察,比如说基因的数据、光谱数据,人工智能的发展后面面临的数据挑战可能是空前的。”
不过王坚也强调指出,今天当大家说AI比人做得好,是AI的成绩比人的成绩做得好,“只是这张考卷它比人做得好一点而已,当我们出不同考卷,结果会不一样。过去对比人跟AI的考卷,事实上并不反映人类真正的能力,我们人类需要一张更有创造力的考卷。”
什么是人类更有创造力的考卷呢?王坚指出,2023年业界觉得写代码机器要超越人类还要很久,而到了2025年4月,机器写的代码已经超过了大部分人类写的代码。“从此人类可以被解放出来,做更具创造性更具有意义的事情。”\大公报记者茅建兴