1 篇博文含有标签「memory-poisoning」

智能体内存投毒：跨会话持久存在的攻击手段

2026年4月10日 · 阅读需 13 分钟

Software Engineer

提示注入吸引了所有关注。但提示注入在会话关闭时就结束了。内存投毒（Memory poisoning）——将恶意指令注入 Agent 的长期内存——会创建一个持久性的漏洞，跨会话存续并在几天或几周后执行，由完全不像攻击的交互触发。对生产级 Agent 系统的研究显示，在受测的基于 LLM 的 Agent 中，注入成功率超过 95%，攻击成功率超过 70%。这是大多数团队尚未防御的攻击向量，且它已经进入了 OWASP Agent 应用前十名（OWASP Top 10 for Agentic Applications）。

核心问题很简单：Agent 将自己的内存视为可信的。当 Agent 从向量库或对话历史中检索“内存”时，它处理这些信息的信心与处理系统指令时相同。没有加密签名，没有来源链，Agent 也没有机制来区分它是从真实交互中形成的内存，还是由上周二处理的某个恶意文档注入的。

关于 Tian Pan