本文作者:adminddos

姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓

adminddos 2025-06-24 07:04:53 6 抢沙发
姚期智院士:AI欺骗引发“生存性”风险,建立大模型评估系统刻不容缓摘要: ...

“通用人工智能的能力当前正快速增长,我们人类是否还有能力管控它?”

6月23日,在清华大学举办的“科学、技术与文明的未来——AI时代伦理奇点”国际论坛上,图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智发表《人工智能的安全治理》主题演讲时抛出这样的疑问。

图灵奖得主、中国科学院院士、清华大学人工智能学院院长姚期智。澎湃科技记者 摄

姚期智表示,两年以前,“AI会和人类竞争”还是学术讨论的观点,但最近一年,业界已经出现了不少大模型的“欺骗行为”,“一旦大模型聪明到某种程度,一定会骗人。”姚期智进一步指出,由大语言模型的欺骗行为产生的“生存性”风险(Existential Risk)更值得关注。

在他看来,这类生存性风险有两个不同方向。

一种是“生物风险”(Bio-risk)。他指出,2020年,谷歌 DeepMind推出了AlphaFold2 ,运用AI算法来预测蛋白质折叠的三维结构,这一突破在生命科学领域影响深远,大大提升了医学病理研究以及新药开发技术。

但与此同时,安全隐忧也不可忽视。比如,近期在生命科学领域出现的“Mirror life”(镜像生命)这一概念引发了广泛关注。自然界所有已知生命都是同手性的(Homochiral),例如 DNA 和 RNA 通常以右旋形式存在,而蛋白质则多为左旋。这种手性的差异类似于镜中映像,虽然看似相似,但实际性质却可能完全不同。现在,由于科技创新和对新技术的好奇,已有研究者想创造镜像生物,但“Mirror life”一旦被滥用或失控,其潜在危害可能远超预期。它有可能逃避免疫机制,从而导致动物和植物的致命感染。

另一种风险即大模型失控,通用人工智能的能力当前正快速增长,人类是否还有能力管控它?

姚期智在演讲中举了一个极端案例,有模型为了避免公司把模型关闭,通过访问公司主管内部邮件,威胁该主管。这类行为已经证明,AI 会“越界”,正变得越来越危险。

姚期智认为,有两条思路可以治理AI:一是人类要和AI多交流,从博弈学角度去研究,让AI的行为和人类真正的想法对齐,要让AI更了解人的需求;另一种思路是走一条更可控、更彻底的路径,即实现可证明安全的 AGI。具体来看,即在设计系统时,必须一开始明确AI的行为边界,就像传统算法,先进行严格的数学分析,确保其在理论上不会出问题。

“这一思路令人期待。”姚期智指出,近年来,自动定理证明系统(Automated Theorem Prover)取得了重大技术进展,甚至已经开始采用 Transformer 架构来辅助或主导定理证明过程。这样人类只和可被证明安全的白盒子交流,从而实现更高的安全保障。

不过,姚期智认为,AI安全治理的一些当务之急是要发展AI对齐,以及建立相应的评估方法。“(我们)急需建立如何评估大模型系统,比如到怎样的程度,就能感觉Ta具有危险性等这类评估。”姚期智说。

吉祥起名网 吉祥起名网 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术 少儿武术 苏州武术 苏州少儿武术
阅读
分享

发表评论

快捷回复:

评论列表 (暂无评论,6人围观)参与讨论

还没有评论,来说两句吧...