全球AI安全研究重心已从静态模型安全,全面转向动态的AI智能体(Agent)运行时安全,核心是防护AI在自主执行、调用工具、操作系统全过程的风险,标志AI安全进入“自主行动安全”新阶段。
传统AI安全聚焦模型层,防范幻觉、有害内容等内容风险;而AI智能体崛起后,具备自主规划、调用API、跨Agent协作等能力,风险从内容输出升级为系统破坏、数据泄露等真实危害,攻击面扩展至感知、决策、执行全链路。
当前主流运行时安全风险包括指令劫持、工具权限滥用、目标漂移、记忆投毒、多Agent协同攻击及身份管理痛点。2026年4-5月,全球相关动向活跃:学术界多篇论文聚焦该领域,微软、谷歌等巨头发布运行时安全框架,安全厂商推出相关防护产品,多国联合发布安全采纳指南。
核心防护技术包括零信任运行时、执行层安全、行为控制与审计、沙箱隔离及轻量化外挂式防护。这一转向源于企业级Agent规模化落地、真实安全事件爆发及传统安全方案失效。
综上,AI安全已进入智能体运行时安全时代,企业需从架构阶段内嵌安全体系,优先部署运行时防护,建立全链路监控、最小权限等安全机制。

