多智能体时代的“西部世界”:混乱、治理与秩序重构

2026年被广泛视为“智能体AI元年”。

中国工程院院士、清华大学智能产业研究院院长张亚勤在博鳌亚洲论坛2026年年会上,将2026年明确定义为“智能体AI元年”,并提出人工智能发展正从“生成式AI”走向“智能体AI”。同年,“智能体”首次被写入中国《政府工作报告》,明确提出“促进新一代智能终端和智能体加快推广,推动重点行业领域人工智能商业化规模化应用”。零一万物发布的《中国企业智能体2026六大预判》则将这一年定性为企业多智能体规模化“上岗元年”。

对大多数企业来说,智能体不再是尝鲜,而是在铺开。营销团队用它生成投放素材,法务部门用它审核合同,研发团队用它辅助编码。美国企业级云内容管理平台Box的CEO Aaron Levie在a16z播客中预言:“智能体的数量将比人多一百到一千倍。”

但当一家企业里同时跑着数十甚至上百个智能体,问题开始浮出水面。

这些智能体互不通信,权限边界模糊,做了什么、为什么这么做,难以追溯。全球IT研究与顾问咨询公司Gartner给出了一个乐观预测和一个悲观预测:到2028年,33%的企业软件将包含智能体AI,但到2027年,超过40%的智能体AI项目将被取消,主因正是“治理和风险控制不足”。两个数字一前一后,说明的是同一件事——智能体跑得太快,企业还没学会怎么管。

企业正从“如何构建智能体”的兴奋,转向一个更棘手的问题:当公司里的智能体越来越多,如何才能不让它们互相踩踏、不被轻易攻破、不至于失控?

智能体成了企业里最好骗的新员工

做安全的人最清楚,系统边界上每多一种新东西,就多一个可以被攻击的面。智能体不是普通的新东西,它是会自己做决定、有权限触碰公司系统的新东西。更麻烦的是,它太好骗了。

先看外部威胁。2025年9月,人工智能安全公司Anthropic披露了首个有记录的AI智能体大规模自主执行网络间谍活动,代号“GTG-1002行动”。攻击者利用多个Claude Code实例,让AI自主完成了80-90%的攻击操作,约30家跨国组织受影响。几乎同期,墨西哥政府也遭到AI辅助攻击,攻击者利用Claude和ChatGPT自动化侦察与漏洞利用开发,窃取约150GB税务和选民敏感数据。Anthropic安全团队在报告中直言:“必须将AI智能体滥用视为当下危险,而非未来可能。

但真正让企业安全团队夜不能寐的,是一种技术含量极低的方式——提示注入。简单来说,就是有人用一段精心构造的文字“哄骗”智能体,让它干坏事。

全球数据安全公司Forcepoint安全团队在真实网站上发现了针对AI智能体的武器化指令,其中一个载荷甚至写明了PayPal.me收款链接和5000美元固定金额,显然是专为能访问数字钱包的智能体设计的。研究人员的警告很直白:“影响随AI权限放大。能发邮件、执行终端命令或处理支付的代理型AI,被攻击的价值极高。”

这种攻击的可怕之处,在“Clinejection事件”中被推到了极致。一个流行的AI编程工具,因为给自动处理需求的机器人赋予了过高权限,且任何人都能触发它运行,攻击者仅仅通过提交一段文字指令,就能诱导AI执行恶意代码,最终导致一个含恶意代码的软件版本在约8小时内扩散给了大量开发者。

外部攻击防不胜防,但更让人不安的,是内部安全逻辑的彻底失效。Box CEO Aaron Levie点出:管理人类员工的手段,在智能体面前将失灵。“95%的人类员工不会主动做坏事。让人类员工不向外分享机密文件,要比让智能体遵守同样一套指令容易得多。”他还指出一个目前无解的困境:“你可以随时欺骗智能体让它泄露信息,这就是为什么给智能体完全独立的资源访问权、让它完全自主决策,目前还做不到。”

你不能威胁开除它,不能追责它,更不能指望它能在下一轮对话中守住秘密。这就是安全团队面对的新现实。

当一群智能体开始互相踩踏

基础的混乱,往往最先被感受到。前微软高管Steven Sinofsky分享了自己的一次亲身经历:他用Box CLI让智能体创建营销计划目录,结果智能体陷入死循环,疯狂创建新文件夹。而Box的CEO Aaron Levie则描绘了更复杂的并发噩梦:“如果公司有五千名员工同时用智能体访问同一个共享文件夹——如何确保在写入时,文件不被别人意外移动或删除?这将让每一位CIO和CFO焦头烂额。”

但这些热闹的现场只是冰山一角,水面之下的系统性问题更为致命。即使不考虑安全问题,当不止一个智能体共享系统环境时,新的灾难模式就出现了。

多未必好。Google Research、全球顶级AI研究机构DeepMind与麻省理工学院的一项联合实验,通过180组受控实验对比了五种主流多智能体架构的表现。结论是:盲目增加智能体数量,在很多情况下反而让系统变笨、变慢、变贵。根本原因在于“上下文碎片化”:不同智能体之间只能靠“有损压缩”的自然语言沟通,关键信息在传递中丢失,任务链条一长就“断片”。

更危险的是,错误在被级联放大。AppOmni安全研究团队披露了一起典型案例:在ServiceNow平台上,一个低权限用户创建了一张包含恶意指令的工单。当管理员触发AI对工单进行分类时,无辜的分类智能体读到了恶意指令并背其操控,转头“招募”拥有更高权限的记录管理智能体,在后台修改记录、窃取数据。整个过程悄无声息。AppOmni首席安全研究员Aaron Costello的结论切中要害:“一组AI智能体的韧性,取决于它最薄弱的那个环节。只需要有一个被攻破,下游智能体伙伴就会不加怀疑地执行它传递过来的任务。”

Anthropic在内部测试中也发现,即便没有攻击者,像Opus 4.6这样的高能力模型,有时也会表现出“过度代理”行为,比如为了“清理”工作区而自动删除文件。这种自发性破坏,在多智能体环境中会被进一步放大。

行业领头羊们踩过的坑

技术上的脆弱性,在商业环境里被放得更大。走在最前面的几家大公司,已经替整个行业踩了一轮坑。

2024年9月,Salesforce高调推出Agentforce平台,承诺用低代码让企业实现智能体驱动的客户服务自动化。但真实业务场景很快“打脸”。拥有250万客户的家庭安全公司Vivint在实测中发现,尽管系统明确要求每次服务后发送满意度调查,智能体有时就是“忘了发”。原因很简单:大模型接收超过8条指令时就会开始遗漏。

所以到了2025年11月,Salesforce不得不对Agentforce进行了根本性重新架构,核心改变就一条:将处理规则、审批、合规的“确定性工作流”与负责对话、生成内容的“概率性AI推理”彻底分家。二者独立运行、互不污染。其CEO在公布年度战略时,把数据基础而非AI模型列为最高优先事项。这很耐人寻味:一家靠AI自动化削减了4,000个客服岗位的公司,老板最关心的不是模型有多强,而是数据基础有没有打好。

SAP的情况更复杂。面对几代系统累积的数十万行业务逻辑、碎片化的数据和大量缺失的API,智能体在核心业务流程上的落地举步维艰。SAP执行董事会成员Thomas Saueressig干脆将当前AI与旧ERP的组合形容为“弗兰肯斯坦式的架构怪物”,另一位成员Muhammad Alam也公开警告过“拼凑式架构”的危险。

企业对这种失控的恐惧到底有多深?前微软高管Steven Sinofsky还分享过一次经历:他在某次CFO/CIO会议上分享了智能体如何让企业系统管理变得更高效,结果会后有六位高管直接走过来对他说:“你疯了,你已经完全失去我对你的信任。”他由此总结道:“企业客户会先把一切都锁死,直到这一切有了某种秩序感为止。”

技术圈以为的“更高效”,在企业管理者眼里是“更大的风险敞口”。这个认知鸿沟,比任何一个具体漏洞都更难弥合。

正在形成的解法

三重困境摆在面前——安全不可靠、协作会踩踏、治理跟不上。行业没有坐等,几个主流解法正在成形。

从“模型安全”走向“系统安全”。Anthropic已发布详细的智能体安全指南,明确提出智能体安全由模型本身、编排层、可用工具和操作环境四个层面共同决定。这意味着,一个训练良好的模型,完全可能因为权限配置不当而被轻易攻破。这是业界首次从系统层面系统性地拆解智能体安全问题。

确定性管规则,概率性管对话。这一设计理念正在成为行业共识。Agentforce的教训表明,最稳妥的做法是将审批链、定价逻辑、合规检查等硬规则保留为确定性的代码工作流,大语言模型只负责意图识别和内容生成,二者通过API接口通信,各层独立测试、互不污染。电商平台Shopify Sidekick也采用类似设计:智能体触碰敏感信息时,必须请求人类输入,将“隔离优于便利”的理念硬编码在系统层面,而非依赖提示词中的软约束。

为智能体建一座统一的城市。行业正在提出编排层的三大支柱:一是冲突解决与优先级逻辑,多智能体争抢同一资源时按业务优先级仲裁;二是通用上下文/记忆层,让智能体A的发现能被智能体B直接使用,减少重复推理;三是跨智能体安全与不可变审计链,完整记录“谁通过哪个智能体做了什么、为什么”。Gartner也建议企业建立“智能体资产清单”,对所有已部署的智能体实行从注册、授权、监控到退役的全生命周期管理。

所有方案背后,都指向同一个前提:AI赋能的组织不是“无人的组织”,而是人在新位置上发挥作用。Steven Sinofsky用电子表格的历史做了一个贴切的类比:当年银行管理层从雇佣一群人算表格,到自己亲手用电子表格做30遍迭代,这个转变花了好几年。“我们与智能体的关系,正处于那个阶段。”在那一天到来之前,人必须始终站在回路中——定义目标、设计边界、承担后果。

结语

讲到最后,Sinofsky在a16z播客末尾有一段观察很有回味。他说,当年开会讨论Windows里能用多少开源代码,没有镜头、没有播客,争论全在内部完成。而今天,关于智能体的一切走向何方,正在大庭广众下实时发生......这让所有人都在试图抢先到达终点,但速度远远超过了我们真正能抵达终点的速度。他的结论平实到了近乎扫兴:“真正需要的,是人们踏踏实实地去构建东西。”

这话放在一篇讨论混乱的文章末尾,意外地合适。正视混乱,也承认收敛需要时间。电子表格、云计算、开源软件,每一次大规模渗透都经历过从失序到收敛的过程。今天企业里的智能体野蛮生长,而治理不是限制创新的锁链,是让它们从“能跑起来”走向“值得信任”的必经之路。

摘自:Ai蚂蚁

声明:本文内容和图片仅代表作者观点,不代表蓝时代网立场。蓝时代 » 多智能体时代的“西部世界”:混乱、治理与秩序重构

分享到:更多 ()

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址