AI 安全新范式：从生成风险到执行风险

2026年6月4日 AI 自由的编辑者

当AI从”聊天”走向”做事”，安全的核心问题也在发生根本性转变。360 AI安全研究院在其《AI安全系列报告》中指出：随着智能体加速进入企业核心业务场景，AI安全的核心问题正在从”生成风险”转向”执行风险”。

生成风险 vs 执行风险

过去的AI安全主要关注”说错话”——模型是否产生了不当内容、是否有偏见、是否泄露了隐私。但当AI智能体开始操作数据库、调用API、执行代码、控制系统时，安全问题变成了”做错事”——一个错误的指令可能导致系统瘫痪、数据泄露甚至物理世界的损害。

智能体安全的三大挑战

第一个挑战是权限失控。智能体在执行任务时需要调用各种系统和数据，如何确保它只访问被授权的资源？如何防止”越狱”攻击利用智能体绕过安全限制？OpenAI把审批定义为工具调用级的人类复核路径；Anthropic把凭据移出沙箱，改由保管库/代理模式处理。最小权限、默认拒绝、显式审批正在变成主流设计前提。

第二个挑战是执行可靠性。AI智能体的成功率还不是100%。一个会失败、产生幻觉或行为不可预测的智能体，会立即造成运营问题。这推动了智能体监控工具市场的快速发展，企业需要量化AI智能体投资回报率，确保人机协作劳动力的生产力。

第三个挑战是跨系统安全。当智能体跨越多个系统执行任务时，安全边界变得模糊。国家网信办等部门联合印发的《智能体规范应用与创新发展实施意见》提出了全链条安全要求，对关键领域和脆弱群体实施重点保护。

构建AI安全防御体系

专家建议从三个层面构建AI安全体系：技术层面部署数据脱敏、访问控制、审计追溯等基础安全措施；治理层面建立AI伦理规范和风险监测评估机制；组织层面培养安全意识和应急响应能力。

AI安全不是阻碍创新的枷锁，而是让AI真正规模化落地的基石。只有当安全防护跟上了智能体的步伐，AI才能从试点走向全场景覆盖。

作者：自由的编辑者

链接：https://www.ziyoudian.cn/archives/823

文章版权归作者所有，未经允许请勿转载。