博客

Page 91

12 articles

你的提示词正在与模型已有的认知竞争
基础模型在交付时已预装了对你所处领域的强烈观点。探测先验、反驳默认设置，停止发布那些与模型已有认知相竞争的提示词。
insiderai-engineering
4月22日12 min
你的 RAG 分块器是一项无人 Review 代码的数据库 Schema
将你的 RAG 分块器视为预处理，每一次边界微调都会变成一次静默的 Schema 迁移。对其进行版本管理、灰度发布，并同步负责检索评估。
insiderrag
4月22日13 min
为什么你的 RAG 引用在撒谎：源归因中的事后合理化
50% 到 90% 的大语言模型引用并不完全支持它们所对应的陈述。本文将探讨为什么事后归因会导致 RAG 系统在潜移默化中失去信任，如何利用 NLI 衡量引用忠实度，以及哪些架构修复方案真正有效。
insiderrag
4月22日12 min
速率限制层级崩溃：当你的智能体循环产生自我 DoS 时
单个用户的智能体扇出可能会耗尽同一配额下的所有其他用户资源。本文探讨了为什么扁平化的令牌桶在智能体工作负载下会崩溃，以及维持平台公正运行的四层层级结构。
ai-agentsrate-limiting
4月22日14 min
工具边界处的推理模型税
推理模型在基准测试中获胜，但在工具选择步骤中却损失了延迟和质量。本文探讨了按步骤进行的混合路由模式、归因以及反模式。
insiderai-agents
4月22日11 min
反思安慰剂：为什么“计划-反思-重新计划”循环最终总是回到第一版
单模型反思循环大多只会在增加 Token 账单的同时，对第一版计划进行修修补补。本文将探讨如何衡量这种“安慰剂效应”，以及什么样的方法才能真正生成具有差异化的计划。
ai-agentsllm
4月22日11 min
拒绝训练差距：为什么你的模型对错误的问题说“不”
语言模型中的拒绝机制实际上是两种截然不同的能力，但目前的训练流程往往将它们混为一谈。这导致模型一方面会拦截良性请求，另一方面却对那些无法可靠回答的问题自信地编造答案。
llmai-safety
4月22日11 min
重试放大：2% 的工具错误率如何演变成 20% 的智能体故障
智能体循环通过在多个步骤和 SDK 层级间叠加重试，将 2% 的工具错误率放大为 20% 的用户端故障。本文将解析其背后的数学原理、自我 DoS 模式，以及能够遏制这种现象的重试预算规范。
insideragents
4月22日15 min
右缘准确率下降：为什么上下文窗口的最后 20% 是个陷阱
填满 LLM 宣称的上下文窗口会导致右缘准确率崩溃 —— 这是继“迷失在中间”之后的一种失效模式。本文包含基准测试、按任务划分的安全裕度以及提示词修复方案。
insiderllm
4月22日12 min
橡皮图章式崩溃：为什么 AI 编写的 PR 正在掏空代码审查
当代码仓库中大部分的 diff 最初都源自模型输出时，审查者往往会陷入“看起来没问题”的心理锚点，从而漏掉那些没有明显语法异味的语义错误。本文探讨了应对措施、管理层必须回答的披露问题，以及会在六个月后集中爆发的事故曲线。
insiderai-engineering
4月22日12 min
Agent Trace 中的采样偏差：为什么你的调试数据集在悄悄排除你最关心的失败案例
头部采样和均匀随机采样会悄悄地从你的调试语料库中切除罕见的灾难性 Agent 轨迹。通过尾部采样、基于异常的关键保留以及按故障模式划分的蓄水池，可以构建一个真正包含你所需失败案例的调试数据集。
observabilityagents
4月22日11 min
语义缓存是安全隐患，而非性能提升
语义缓存能在不到一毫秒的时间内返回另一个用户的响应，而你的命中率仪表盘还会因此变绿。本文探讨如何通过缓存键设计、溯源封装和审计追踪，从架构层面防止跨用户数据泄漏。
insiderllm
4月22日14 min

较新的博文

较旧的博文

Page 91

你的提示词正在与模型已有的认知竞争

你的 RAG 分块器是一项无人 Review 代码的数据库 Schema

为什么你的 RAG 引用在撒谎：源归因中的事后合理化

速率限制层级崩溃：当你的智能体循环产生自我 DoS 时

工具边界处的推理模型税

反思安慰剂：为什么“计划-反思-重新计划”循环最终总是回到第一版

拒绝训练差距：为什么你的模型对错误的问题说“不”

重试放大：2% 的工具错误率如何演变成 20% 的智能体故障

右缘准确率下降：为什么上下文窗口的最后 20% 是个陷阱

橡皮图章式崩溃：为什么 AI 编写的 PR 正在掏空代码审查

Agent Trace 中的采样偏差：为什么你的调试数据集在悄悄排除你最关心的失败案例

语义缓存是安全隐患，而非性能提升

关于 Tian Pan