博客

Page 153

12 articles

合理补全陷阱：为什么代码智能体会生成看似正确实则错误的代码
代码智能体生成的代码能够编译、通过Lint检查、看起来正确，但却在悄无声息地做着错误的事。这里揭示了训练目标为何从根本上导致这一问题，数据说明了什么，以及如何构建真正能发现问题的验证循环。
ai-engineeringcode-agents
4月11日11 min
提示注入攻击面映射：在攻击者之前找到每一个攻击向量
一份实践者方法论：枚举每一个到达 LLM 提示的外部数据源，对每个注入面进行风险评分，并在不破坏模型推理能力的前提下应用正确的净化模式。
insidersecurity
4月11日12 min
LLM 系统的基于属性的测试：即便输出多变也需遵循的不变量
评估数据集告诉你你的 LLM 是否通过了一组固定的示例。而基于属性的测试则告诉你它是否在整个输入空间内都遵守契约。本文将介绍如何将其应用于非确定性系统。
llmtesting
4月11日14 min
供应商锁定深度分析：导致更换 LLM 供应商变成 6 个月工程项目的七个耦合点
从提示词语法、工具调用 Schema 到嵌入空间和计费模型，这七个隐藏的耦合点解释了为什么更换 LLM 供应商需要数月而非数天。本文提供了一个实用的审计框架，帮助你主动管理锁定风险。
insiderllm-ops
4月11日13 min
并发智能体系统中的竞态条件：那些看起来像幻觉的 Bug
并行子智能体会以一种看起来完全像模型幻觉的方式静默地损坏共享状态。以下是生产环境智能体系统中读-改-写竞态的工作原理、哪些分布式系统原语能解决它们，以及区分并发 bug 与真正模型故障的检测手段。
insidermulti-agent
4月11日15 min
合并再调用：无需降低用户体验即可削减成本的 LLM 请求批处理模式
请求合并是一种分层架构——飞行中去重、精确缓存和语义批处理——可在不降低用户体验的情况下将 LLM 推理成本降低 40–60%。本文介绍如何实现以及在哪些地方会遇到问题。
llmcost-optimization
4月11日12 min
Schema 驱动的 Prompt 设计：让你的数据模型主导 Prompt 结构
你的实体 Schema 形态直接决定了 LLM 输出的可靠性。了解规范化、嵌套深度、字段排序和枚举约束如何影响幻觉率 —— 以及掌握让 Prompt 到输出的映射更具可预测性的重构模式。
insiderllm
4月11日12 min
智能体测试的模拟环境：构建代价为零的沙箱
“看起来像生产环境” 的预发布环境往往误导性大于指导意义。本文将介绍如何构建模拟环境，让智能体在伪造的基础设施上执行真实操作，并阐述为什么只模拟不可逆工具是投资回报率最高的方法。
ai-agentstesting
4月11日11 min
非确定性系统的 SLO：当每次响应都不同时如何定义可靠性
传统 SLI（如延迟和错误率）无法捕捉 AI 系统的主要故障模式——执行正确但答案错误。本文提供了一套实用框架，涵盖语义 SLO、85% 基线下的错误预算，以及能区分真实退化和正常波动的告警架构。
reliabilitysre
4月11日10 min
投机解码实战：那顿并非免费的午餐
投机解码如何通过小模型起草 token 并行验证，将 LLM 推理延迟降低 2-3 倍——以及草稿模型选择的数学原理、批处理大小的权衡和生产环境中决定你是获得加速还是减速的那些陷阱。
insiderinference-optimization
4月11日11 min
有状态 vs. 无状态 AI 功能：决定一切下游走向的架构抉择
有状态与无状态 AI 功能的选择往往在早期就已确定，但其影响无处不在——存储层、调试工具链、安全态势以及成本。本文将帮助你做出审慎的抉择。
insiderai-architecture
4月11日13 min
结构化输出与约束解码：消除生产LLM系统中的解析脆弱性
约束解码在token级别保证LLM输出符合schema，从生产流水线中移除重试逻辑和解析启发式方法——但研究显示存在17%的创造力成本，需要明确的决策框架。
insiderstructured-outputs
4月11日11 min

较新的博文

较旧的博文

Page 153

合理补全陷阱：为什么代码智能体会生成看似正确实则错误的代码

提示注入攻击面映射：在攻击者之前找到每一个攻击向量

LLM 系统的基于属性的测试：即便输出多变也需遵循的不变量

供应商锁定深度分析：导致更换 LLM 供应商变成 6 个月工程项目的七个耦合点

并发智能体系统中的竞态条件：那些看起来像幻觉的 Bug

合并再调用：无需降低用户体验即可削减成本的 LLM 请求批处理模式

Schema 驱动的 Prompt 设计：让你的数据模型主导 Prompt 结构

智能体测试的模拟环境：构建代价为零的沙箱

非确定性系统的 SLO：当每次响应都不同时如何定义可靠性

投机解码实战：那顿并非免费的午餐

有状态 vs. 无状态 AI 功能：决定一切下游走向的架构抉择

结构化输出与约束解码：消除生产LLM系统中的解析脆弱性

关于 Tian Pan