跳到主要内容

影子 AI:你的团队已经上线的 AI 智能体

· 阅读需 10 分钟
Tian Pan
Software Engineer

影子 IT 曾经意味着营销团队报销 SaaS 订阅,或者工程师私自创建 S3 存储桶。这很烦人,是采购方面的头疼问题,但大部分情况下是可以承受的。影子 AI 也是出于同样的本能——绕过缓慢的官方路径——只不过爆炸半径更大,且进入门槛几乎降至为零。

一名工程师可以在一个下午将 LLM API 调用接入生产工作流。一名支持主管可以在午饭前搭建一个无代码的分流智能体。一名数据分析师可以将一个季度的客户记录粘贴到聊天窗口中,以“快速总结一下”。这些都没有经过审查,没有出现在架构图中,而且你的治理计划无法保护一个它根本不知道存在的系统。

令人不安的是规模。2025 年 UpGuard 的一项调查发现,超过 80% 的员工——以及近 90% 的安全专业人员——在工作中使用未经批准的 AI 工具。你的安全团队在用,你的高管也在用。问题不在于你是否有影子 AI,而在于你是否能看到它。

影子部署的门槛降至为零

之前的每一波影子 IT 都有摩擦。启动一台违规服务器意味着需要云端凭据和信用卡。采用未经授权的 SaaS 工具意味着需要注册流程,并最终产生一份财务部门会注意到的发票。

AI 消除了这一切。“在生产中使用模型”的官方路径——供应商安全审查、数据处理协议、采购周期、平台团队工单——仍然需要数周时间。而非官方路径只需要一个 API 密钥和一次 pip install。当官方途径耗时一周而影子途径只需一个下午时,影子途径每次都会胜出,且差距悬殊。

这就是为什么数字在不断攀升。毕马威(KPMG)的一份报告发现,大约一半的员工在未经雇主批准的情况下采用 AI 工具。Gartner 测得 68% 的员工在没有 IT 部门签字的情况下使用 AI 工具。微软的研究发现,78% 的 AI 用户自带工具,而不是等待公司批准的选择。这些不是边缘案例或违规分子——这是普通员工为了完成工作而做出的理性决策。

智能体(Agent)的情况更糟,因为智能体看起来不像影子 IT 以前能捕捉到的工具。DNS 日志中没有新的 SaaS 域名,报销单中也没有新的供应商。有的只是几百行 Python 代码,它们导入 SDK,在环境变量中保存 API 密钥,并静静地每天调用模型几千次。一项行业调查报告称,96% 的企业现在在生产中运行 AI 智能体,94% 的企业认为由此产生的蔓延是一个真正的安全问题——而只有 12% 的企业有任何中央管理手段。

你看不见的地方才是真正的风险

影子 AI 的危险不在于员工使用模型,而在于没有人能回答流经这些模型的数据的基本问题。

当分析师将客户记录粘贴到消费级聊天机器人时,该数据就离开了你的信任边界,进入了你从未阅读过其保留政策的第三方模型。趋势线非常陡峭:一项分析发现,员工输入到 AI 工具中的公司数据中有 27.4% 是敏感数据——高于一年前的 10.7%。而且渠道几乎总是个人性质的:72% 的员工使用个人电子邮件账号登录这些工具,只有 11% 使用受控的公司渠道。Netskope 的 2026 年报告指出,职场生成式 AI 使用中个人账号的占比接近 47%。

这种组合——敏感数据加上个人账号再加上没有日志——是一个等待审计员发现的合规事故。根据 GDPR,在没有数据处理协议的情况下将个人数据输入公共 LLM,本身就可能构成《第 33 条》规定下的应报告漏洞。同样的风险也适用于 HIPAA、PCI DSS 和 SOC 2。你无法证明一个你甚至不知道正在被绕过的控制措施。

财务方面的表述使其更加具体。IBM 的《2025 年数据泄露成本报告》将 20% 的泄露归因于影子 AI,并测算其成本溢价约为 67 万美元——影子 AI 导致的泄露平均成本为 463 万美元,而没有 AI 因素的泄露成本为 396 万美元。Gartner 预计,到 2030 年,超过 40% 的企业将经历直接追溯到影子 AI 的安全或合规事故。

智能体的失效模式比泄露更隐蔽。一个拥有真实 API 密钥和真实工具访问权限的影子智能体可以执行真实的操作——提交工单、发送电子邮件、更新记录、转移资金——当它做错事时,没有审计跟踪来重现发生了什么,因为系统从未配置过监控。你在从未见过代码的情况下继承了法律责任。

镇压会让问题变得不可见,而不是变小

本能的反应是禁止:封锁域名、禁用工具、发送严厉的邮件。这行不通,而且会主动让你的安全态势变得更糟。

禁止虽然官方但缓慢的工具并不能消除潜在的需求——工作仍然需要完成。它只是将行为推向了你无法监控的地方。员工从你至少可以审计的公司 ChatGPT 账号切换到个人手机上的个人账号。工程师将 API 密钥从有日志的服务转移到本地脚本中。你名义上在监视的流量消失在你完全无法看到的渠道中。

禁令还将一个可管理的治理问题转化为一个对抗性问题。一旦使用 AI 成为可以被解雇的借口,就没人会告诉你他们在运行什么。你失去了最好的发现来源——人们自愿提到他们构建了什么——你换来的是一群学会了隐藏的劳动力。超过 80% 的采用率并不会下降,它只是转入地下。

坦诚地说,禁止是治标不治本。如果你有一半的员工都在绕过官方路径,那么官方路径本身就是坏掉的。镇压只是拒绝承认这一点。

发现你已有的“影子舰队”

在治理影子 AI 之前,你必须先对其进行盘点,而用于盘点的工具大多是现成的 —— 只是以前它们被用于处理 SaaS 的无序扩张。

  • 网络出站流量监控。 模型提供商会发布他们的 API 端点。从那些本不该调用模型的业务主机发往这些端点的出站流量,是你获得的最直接的高信号线索。虽然这不能捕获所有情况 —— 例如通过手机网络在个人设备上产生的流量是不可见的 —— 但它能暴露出最重要的生产环境集成。
  • API 密钥和机密清单。 大多数影子代理通过环境变量、CI 机密,或者 —— 令人担忧的是 —— 代码仓库中的硬编码字符串进行身份验证。在你的代码库和配置库中进行机密扫描,可以将“我们一无所知”变成一份具体的清单。提供商的账单仪表板是第二个角度:组织级的 API 账户可以显示存在哪些密钥以及每个密钥的支出。
  • 报销报告和账单取证。 无代码代理和个人 AI 订阅往往表现为小额的定期支出。将 AI 供应商的账单细目与你的获批供应商名单进行对账虽然乏味,但它能找出那些“长尾”部分。
  • 身份提供商 (IdP) 发现。 许多 AI 工具使用单点登录。与你的 IdP(如 Google Workspace、Microsoft Entra)建立只读连接,可以列出员工已授权哪些第三方 AI 应用访问公司目录。这是大多数商业 AI 发现产品的工作原理,而你直接就能获取到底层的信号。

这些方法单独使用都不完整。但结合在一起,它们能将影子 AI 从“未知的未知”转化为你可以进行分类处理的清单。云安全联盟 (Cloud Security Alliance) 清晰地定义了完整序列:发现、分类、评估风险、实施控制、监控。发现是第一步,而大多数组织从未真正执行过这一步。

唯一持久的解决方法是更快的“铺设道路”

发现只能告诉你存在什么。它不会改变产生这些问题的诱因。只要正式路径比工作需求慢,每个新入职的员工都会在一个月内重新发现那条影子路径。

解决方法是让官方路线成为阻力最小的路径 —— 一条真正比影子路径更易于通行的“铺好的路”。具体来说,这意味着提供一种经批准的模型调用方式,让工程师在打算“单干”的那个下午就能轻松采用:

  • 模型网关。 一个代理到模型提供商的统一内部端点,让你可以在一处地方强制执行身份验证、记录每个请求和响应、脱敏或拦截敏感数据、将成本归因于团队,以及在不改动应用程序代码的情况下更换提供商。在开发者看来,这只是一个基准 URL 和一个密钥 —— 这比注册个人账号还要简单,而不是更麻烦。
  • 预先审核的提供商和默认密钥。 如果数据处理协议 (DPA) 已经签署,且只需通过自助请求即可获得限权密钥,那么促使人们转向个人账号的采购延迟就会消失。
  • 显而易见的、经批准的无代码选项。 正在自动化处理分类工作的支持主管不会去提交架构评审。给他们一个真正可用的、受治理的低代码平台,否则他们就会使用不受控的平台。
  • 自带的可观测性。 当“铺好的路”默认记录使用量、成本和工具调用时,治理就不再是开发者必须支付的“税收”,而成了平台的一种属性。

Gartner 预计,AI 治理支出将在 2026 年超过 4.92 亿美元,并在 2030 年超过 10 亿美元。如果这些钱仅花在检测和强制执行上,那买到的是一场军备竞赛。如果花在铺设道路上,那买到的是一条人们真正想要走的路。

影子 AI 是症状,而非病根

最有效的认知转变是停止将影子 AI 视为纪律问题。员工并不是不计后果,他们是在追求效率 —— 对比截止日期更慢的官方流程做出的理性反应。

每一个影子代理都是一条微小而精确的反馈:这是工作所需的任务,而官方路径所需的时间是这么长。从这个角度看,你的影子 AI 清单也是一份待办列表。它准确地告诉你应该优先铺设哪些功能,以及哪些评审步骤正在让你失去你想要的透明度。

从发现开始,因为你无法治理你看不到的东西。但不要止步于此,不要把严厉打击误认为战略。能够平稳渡过这一关的组织,不会是那些封禁工具最多的组织,而是那些官方路径足够快,以至于影子路径不再值得费力尝试的组织。

References:Let's stay in touch and Follow me for more thoughts and updates