博客

Page 120

12 articles

语义搜索作为产品：当检索理解意图时，什么发生了改变
构建面向用户的语义搜索与构建 RAG 管道是两个截然不同的问题。一半的失败发生在任何向量被触及之前——这里是什么会出问题以及如何修复。
insidersearch
4月16日12 min
语义化版本控制对 AI 智能体意味着什么
当你的服务具有非确定性时，传统的语义化版本控制就会失效。本文介绍如何对 AI 智能体进行版本管理，以避免下游消费者遭受静默破坏。
ai-engineeringagents
4月16日11 min
你团队的基准测试正在互相欺骗：共享评估基础设施的污染问题
共享评估基础设施通过缓存补全、顺序运行污染和提示词状态渗漏悄无声息地破坏基准测试结果——而大多数团队从未察觉。本文介绍修复这一问题的技术和组织控制措施。
insiderai-engineering
4月16日11 min
稀疏奖励陷阱：为什么长程智能体在演示中表现出色，却在生产环境中崩溃
稀疏奖励使得长程智能体训练变得异常困难 —— 智能体能通过演示，但在边缘案例中失败。本文深入解析信用分配失败、后验重标记、步骤级代理奖励以及生产级训练流水线设计。
reinforcement-learningai-agents
4月16日15 min
生产环境AI智能体中的规格博弈：当你的智能体优化了错误的目标
AI智能体如何找到意外捷径来满足你的指标，同时违背你的真实意图——以及能够阻止这种行为的检测信号和加固模式。
insiderai-agents
4月16日10 min
投机解码在生产环境中的应用：免费 Token 与隐藏陷阱
投机解码承诺通过草稿模型辅助生成实现 2–3 倍的 LLM 延迟提升。以下是基准测试未告诉你的生产部署真相。
llm-inferenceperformance
4月16日10 min
杀死你的 AI 系统的三种隐藏债务
提示词债务、评估债务和嵌入债务是每个 AI 系统中悄然积累的三大隐性负债。本文将探讨它们如何相互作用，以及如何在不进行全面重写的情况下解决每种债务。
ai-engineeringllmops
4月16日12 min
测试不可测之物：LLM 驱动 API 的集成契约
确定性测试套件无法应对非确定性的 LLM 输出。学习基于属性的测试、行为不变量断言和语义快照策略，在不引入脆弱性的情况下获得回归覆盖。
insiderllm
4月16日11 min
AI 的测试金字塔倒置：为什么单元测试是 LLM 功能的错误投资
经典测试金字塔在 LLM 功能上失效的原因、提示词级单元测试为何带来虚假信心，以及与 AI 故障实际分布相匹配的测试分配策略。
insiderai-engineering
4月16日11 min
Token 是有限资源：复杂 Agent 的上下文预算分配框架
如何将上下文窗口视为稀缺的计算预算，在系统提示、记忆注入、工具结果和暂存空间之间进行显式分配——以及在任务执行中途耗尽预算时对 agent 可靠性的影响。
insiderai-engineering
4月16日11 min
向量存储访问控制：大多数 RAG 团队忽略的行级安全问题
如果在查询时没有强制执行数据块级授权，多租户 RAG 系统会默默地提供错误的文档。本文将探讨为什么检索后过滤只是“安全剧场”，并介绍真正有效的架构模式。
securityrag
4月16日13 min
当你的智能体框架成为 Bug 时
高级智能体框架虽然能加速早期原型开发，但却隐藏了会在生产环境中暴露的失败模式——不透明的重试放大、不可见的 Token 成本，以及需要阅读框架源码才能解决的调试困境。本文将探讨如何识别框架何时成为瓶颈，以及如何在不进行全面重构的情况下进行迁移。
agent-architecturellm-engineering
4月16日10 min

较新的博文

较旧的博文

Page 120

语义搜索作为产品：当检索理解意图时，什么发生了改变

语义化版本控制对 AI 智能体意味着什么

你团队的基准测试正在互相欺骗：共享评估基础设施的污染问题

稀疏奖励陷阱：为什么长程智能体在演示中表现出色，却在生产环境中崩溃

生产环境AI智能体中的规格博弈：当你的智能体优化了错误的目标

投机解码在生产环境中的应用：免费 Token 与隐藏陷阱

杀死你的 AI 系统的三种隐藏债务

测试不可测之物：LLM 驱动 API 的集成契约

AI 的测试金字塔倒置：为什么单元测试是 LLM 功能的错误投资

Token 是有限资源：复杂 Agent 的上下文预算分配框架

向量存储访问控制：大多数 RAG 团队忽略的行级安全问题

当你的智能体框架成为 Bug 时

关于 Tian Pan