LLM 自我调试:解释何时是信号,何时是谎言
当你的 LLM 智能体失败时,最诱人的事情莫过于问它为什么。它会给出流畅、具体、看似充满自我意识的回答。它可能会说:"我误解了用户的意图,检索了关于 X 的文档,而实际上应该定向到 Y。"听起来就像是根本原因。你把它记下来,打开提示编辑器,然后花四十分钟追查一个错误的问题。
这就是 LLM 自我调试的核心陷阱。模型的解释和模型实际的失败机制是两回事。有时两者重叠,但经常并不重合。在采取行动之前判断自己处于哪种情况,是区分快速调试和昂贵弯路的关键所在。
