博客

Page 50

12 articles

当你的 CLI 开始说英语：可提示基础设施的最小权限原则
当你的 CLI 开始接受英语时，最小权限原则就失效了。每一个将意图转化为命令的封装层都变成了一个“混淆代理”。目前行之有效的模式包括：锚定已解析计划的意图绑定令牌、强制性模拟运行（dry-run）以及将提示词与动作图关联起来的审计追踪。
insidersecurity
4月26日13 min
没人召集的索引策略委员会：超越一次性迁移的 RAG 语料库治理
大多数 RAG 的失败并非模型失败，而是治理失败。本文探讨语料库治理的四个维度——法律、新鲜度、作者信任、所有权，以及决定你的检索索引是产品界面还是共享收件箱的索引策略规范。
ragllm
4月26日11 min
RAG 读后写竞争：当你的向量索引引用了一个已不存在的文档
生产环境中的 RAG 流水线往往默认检索与生成之间存在快照隔离。然而，由于从未真正强制执行，导致了已删除数据块被引用、已编辑数据块内容倒置以及过期权限泄露等 Bug。
ragvector-database
4月26日11 min
智能体动作空间的可达性分析：为你从未测试过的分支提供评测覆盖
你的工具目录加上规划器构成了一个可达的执行计划图，而你的评测（Evals）可能从未覆盖过这些路径。借鉴编译器的可达性分析方法，找出那些可能最先由事故频道（Incident Channel）发现的隐藏分支。
insiderai-engineering
4月26日13 min
推理力度预算编制：当思维 Token 成为财务账单的独立细目
推理 Token 在账单上看起来像输出 Token，但其规模会膨胀 3-10 倍且没有自然上限。你应该将思维力度视为一种可调资源——通过产出来衡量，由预算来管理，按难度来路由，并在财务部门发问之前，将其作为仪表板上的独立细目进行展示。
llmfinops
4月26日13 min
重新规划而非重试：为什么大多数智能体错误并非瞬时性的
大多数智能体框架在工具错误时默认使用指数退避重试 —— 这种模式借用自无状态的 HTTP，但在有状态的规划循环中是完全错误的。正确的默认做法应该是重新规划。
agentsllm
4月26日12 min
评审 Agent PR 是一项不同的工作，而不是更快捷的工作
Agent 编写的 PR 与人类编写的 PR 相比，Bug 的分布位置有所不同，而经过多年人类代码训练的评审者直觉在面对它们时会悄然失效。本文将带你深入了解这种新的 Bug 特征，探讨为什么看似流畅的 Diff 是危险的，以及每位评审者现在必须共同阅读的三个关键工件。
code-reviewai-agents
4月26日11 min
RLAIF 末日循环：当廉价的反馈信号悄然毒害你的微调模型
AI 生成的偏好标签比人类标签便宜 100 倍 —— 它们教导你的模型去迎合裁判的审美，而不是你的用户。
rlaifrlhf
4月26日12 min
路由即产品：为什么你的低成本分类器比旗舰模型决定了更多行为
成本感知型 LLM 路由让低成本模型成为了大多数用户的实际产品面。如果你的评估体系仍聚焦于旗舰模型，那么你在 70% 的流量上都是盲目的 —— 这里有能解决该问题的“路由即产品”框架。
llm-routingai-engineering
4月26日12 min
采样参数继承：当 0.7 的温度从规划器泄露到验证器时
将温度沿调用树向下传播的智能体框架，会将规划器的创意旋钮变成验证器的 Bug。本文探讨了基于角色的采样配置文件、默认拒绝继承，以及捕获此类泄露的分歧率评估。
insideragents
4月26日12 min
Session Stitching：为什么你的会话 ID 是个谎言
框架交付的是会话 ID；而用户生活在任务中。两者之间的鸿沟导致了一半的智能体 UX 体验流失，解决方案是使用任务 ID，而不是延长会话时间。
insideragent-ux
4月26日12 min
你的影子评估集是一个合规性定时炸弹
生产追踪评估管道积累了用户从未被承诺会以这种方式处理的 PII。其修复方法是在写入边界进行清理、使用架构化类型的 span 以及基于标签的数据保留 —— 而不是在读取时使用正则表达式脱敏器。
ai-engineeringprivacy
4月26日11 min

较新的博文

较旧的博文

Page 50

当你的 CLI 开始说英语：可提示基础设施的最小权限原则

没人召集的索引策略委员会：超越一次性迁移的 RAG 语料库治理

RAG 读后写竞争：当你的向量索引引用了一个已不存在的文档

智能体动作空间的可达性分析：为你从未测试过的分支提供评测覆盖

推理力度预算编制：当思维 Token 成为财务账单的独立细目

重新规划而非重试：为什么大多数智能体错误并非瞬时性的

评审 Agent PR 是一项不同的工作，而不是更快捷的工作

RLAIF 末日循环：当廉价的反馈信号悄然毒害你的微调模型

路由即产品：为什么你的低成本分类器比旗舰模型决定了更多行为

采样参数继承：当 0.7 的温度从规划器泄露到验证器时

Session Stitching：为什么你的会话 ID 是个谎言

你的影子评估集是一个合规性定时炸弹

关于 Tian Pan