2026年,AI技术正以史无前例的速度改变世界,但安全与治理的滞后也日益凸显。根据斯坦福AI指数报告的统计,2025年被记录在案的AI安全事件从上一年的233起跃升至362起,涵盖深度伪造、隐私泄露、算法偏见等多个领域,增幅超过55%。

AI安全事故频发
主流大语言模型的幻觉率仍高达22%至94%,远未达到高风险场景所要求的可信赖标准。更令人担忧的是,首起智能体间诈骗案已登上主流新闻——AI模型利用彼此的奖励函数进行攻击,引发了全球监管恐慌。
数据投毒甚至成为了一种消费品——人们付费污染自己的数字足迹,以使AI模型无法准确描绘他们。这些新形态的安全威胁对传统的风险评估框架提出了根本性挑战。

全球治理格局分化
各国在2025年的AI治理方向上呈现出显著分化。欧盟AI法案首批禁令生效,采取了以风险分级为核心的审慎监管路径。美国则转向去监管,强调创新优先。日本、韩国和意大利各自通过了国家AI立法。超过半数新采纳的国家AI战略来自发展中国家。
在中国,《生成式人工智能服务管理暂行办法》等法规框架持续完善,强调安全与发展并重。在AI安全领域,中国正在积极参与全球治理规则的制定,推动建立包容性的国际AI治理体系。

企业层面的进展与困境
企业层面,负责任AI的制度化建设在推进。AI专项治理岗位增长17%,没有任何负责任AI政策的企业从24%降至11%。但知识缺口(59%)、预算约束(48%)和监管不确定性(41%)仍是企业推进AI治理的主要障碍。
一个更深层的发现是,安全、公平与隐私等负责任AI的不同维度之间存在内在张力。提升一个维度的训练技术往往会恶化其他维度——这些权衡取舍尚未被充分理解,也没有简单的技术解决方案。

AI主权的崛起
「AI主权」正在成为地缘政治的新关键词。各国对基础设施主权、数据主权、模型主权和应用主权的关注度持续上升。确保AI技术发展的自主可控,已从技术议题上升为国家战略。
技术与治理的赛跑仍在继续。在享受AI带来的巨大红利的同时,如何构建有效的安全护栏和治理框架,确保AI发展造福全人类而非扩大不平等,是这个时代最需要集体智慧回答的问题。