博客

Page 58

12 articles

工具目录中的依赖炸弹：为什么增加一个工具会破坏五个智能体
在智能体的工具目录中添加新工具会重新分配规划器在每个条目上的选择概率，从而在静默中重定向那些你的评估套件从未想过要测试的工作流。
ai-agentstool-calling
5月8日10 min
我们已经有了：当 AI 功能在重新造你已有的代码轮子
在成熟的公司中，大多数 AI 功能其实是在重复代码库中已有的逻辑。解决方法是在开发前进行审计，并采用一种组合模式，让模型成为备选路径而非首选路径。
insiderai-engineering
5月8日13 min
每个开放 RAG 系统自带的攻击向量
当用户可以向你的知识库贡献内容时，他们并不是唯一的写入者。在 260 万个条目的语料库中，仅需 5 份恶意文档即可实现 97% 的攻击成功率 —— 且流水线不会显示任何错误。
ragsecurity
5月7日11 min
孤儿微调：基础模型废弃后如何恢复领域专业知识
当基础模型被废弃时，微调后的领域专业知识不会自动迁移。三条恢复路径——行为蒸馏、重新标注和提示编码——以及提前规划的重要性。
fine-tuningllm
5月7日10 min
LLM 输出的统计水印：Token Logit 偏置如何创建可检测的签名
LLM 文本水印在推理阶段将统计可检测的签名嵌入 token logit 概率中。本文介绍绿/红名单方案的工作原理、Google SynthID-Text 为何属于半脆弱性水印，以及生产工程师在将水印用于合规或归因之前需要了解的关键信息。
llmwatermarking
5月7日10 min
80% 陷阱：聚合 RAG 指标如何掩盖系统性长尾失效
报告 80% 检索准确率的 RAG 系统往往掩盖了长尾查询中的系统性失效。本文将探讨如何审计覆盖范围缺口，并在不降低头部性能的情况下进行修复。
insiderrag
5月7日11 min
稀疏信号问题：当无法进行 A/B 测试时如何衡量 AI 功能质量
B2B AI 功能鲜少拥有足够的日活用户来支撑 A/B 测试。本文介绍如何在频率统计无法规模化时，利用贝叶斯方法、代理信号和结构化专家知识获取来衡量质量。
insiderai-evaluation
5月7日11 min
Agent 的写操作侧：在行动层设计可逆性
AI Agent 的每一次写操作都是一个潜在的事故。如何在 Agent 删除无法找回的数据之前，为行动层设计可逆性。
insiderai-engineering
5月6日12 min
撒谎的 AI A/B 测试：LLM 实验中的新奇效应、结转偏差与锚定偏差
三种心理偏差——新奇效应、锚定偏差和结转偏差——会系统性地夸大 AI 功能的 A/B 测试结果，而标准的留存组（Holdout Group）方案对这些都无能为力。本文将介绍一种真正有效的纵向队列设计（Longitudinal Cohort Design）。
insiderab-testing
5月6日12 min
能真正收敛的 AI 澄清对话：面向单轮解决的设计方案
多轮澄清循环会让用户感到沮丧，并降低 LLM 的性能。本文介绍了一个设计框架，旨在通过信息增益优先级、置信度阈值门控和架构约束，让 AI 系统在单轮对话中解决歧义。
ai-agentsconversational-ai
5月6日12 min
AI 代码审查倒置：当作者是机器时应关注什么
当 AI 智能体编写了你大部分的提交时，逐行代码的正确性审查会忽略那些关键的漏洞。这里有一套真正适用于机器创作代码的审查规范。
insiderai-engineering
5月6日10 min
AI 副驾驶 vs. AI 飞行员：基于证据的产品决策框架
具体的已部署系统信号——任务完成率、错误恢复时间、用户覆盖频率、边缘案例暴露——决定了 AI 应该是建议性的还是自主性的，以及错误的默认选择如何侵蚀那些难以挽回的用户信任。
insiderai
5月6日10 min

较新的博文

较旧的博文

Page 58

工具目录中的依赖炸弹：为什么增加一个工具会破坏五个智能体

我们已经有了：当 AI 功能在重新造你已有的代码轮子

每个开放 RAG 系统自带的攻击向量

孤儿微调：基础模型废弃后如何恢复领域专业知识

LLM 输出的统计水印：Token Logit 偏置如何创建可检测的签名

80% 陷阱：聚合 RAG 指标如何掩盖系统性长尾失效

稀疏信号问题：当无法进行 A/B 测试时如何衡量 AI 功能质量

Agent 的写操作侧：在行动层设计可逆性

撒谎的 AI A/B 测试：LLM 实验中的新奇效应、结转偏差与锚定偏差

能真正收敛的 AI 澄清对话：面向单轮解决的设计方案

AI 代码审查倒置：当作者是机器时应关注什么

AI 副驾驶 vs. AI 飞行员：基于证据的产品决策框架

关于 Tian Pan