博客

Page 54

12 articles

AI产品的暗能量：没人预算过的后台计算
每个拥有持久化状态的AI产品都在运行不可见的推理，这些推理永远不会出现在你的延迟仪表盘或成本模型中。本文告诉你如何找到它、度量它，并决定是否关掉它。
insiderai-engineering
5月4日11 min
为什么你的应用日志无法还原 AI 决策
应用日志记录的是执行过程，而非推理过程。AI 系统做出依赖上下文的决策，必须通过提示词版本、检索文档和工具调用追踪才能还原。以下是 SRE 团队的监控盲区与 AI 合规真正需要之间的差距所在。
observabilityai-engineering
5月4日12 min
构建信任修复流程：当你的 AI 犯下显而易见的错误后该怎么办
一份关于在 AI 系统出现显性错误时设计信任修复流程的实践指南 —— 涵盖软失败与硬失败、优雅降级、撤销流程，以及真正衡量信任是否恢复的指标。
insiderai
5月4日11 min
平庸 AI 宣言：为什么单个提示词的表现优于你的自主智能体
80% 的 AI 项目以失败告终，而那些悄无声息地产生回报的项目往往是分类器、路由器和提取器——而非自主智能体。本文探讨了为什么团队总在构建错误的东西，并提供了一个将 AI 复杂度与实际业务价值相匹配的框架。
ai-engineeringagents
5月4日11 min
面向 Agent 与 RAG 的分块：为什么一套方案会同时拖累两者
RAG 检索与 Agent 执行对分块有着截然相反的需求。对两者使用同一种策略会悄无声息地降低性能。本文将揭示其背后的原理以及如何修复。
insiderrag
5月4日11 min
代码所有权衰减：当 AI 编写大部分提交时，团队知识会发生什么
当 AI 编写了你团队的大部分提交时，git blame 不再能回答那个真正关键的问题：为什么。本文探讨了代码所有权是如何默默衰减的，以及工程团队正在采取哪些措施来阻止这一趋势。
ai-engineeringcode-review
5月4日11 min
复合幻觉问题：多阶段 AI 流水线如何放大错误
在多阶段 AI 流水线中，幻觉不仅会持续存在，还会成倍增加。每个阶段都会将前一阶段的输出视为事实，从而将一个简单的错误事实演变成一个看似确凿却完全错误的最终答案。本文将探讨这一系统层面的问题及其解决方案。
insiderai-engineering
5月4日12 min
上下文压缩失真：你的摘要中间件在悄悄丢失什么
上下文摘要是应对上下文限制的标准方案——但它会以不均匀的方式破坏信息。否定表达、精确数字、条件依赖关系和工具输出归因最先消失。以下是从业者需要了解的内容。
llmai-engineering
5月4日11 min
上下文长度军备竞赛：为什么填满窗口是错误的目标
每个大模型新版本发布时都会宣传更大的上下文窗口。但实践者正在发现，填满窗口会降低质量、增加延迟并消耗预算——而稀疏、精心筛选的上下文始终优于朴素的堆砌方式。
insiderllm
5月4日8 min
上下文限制是一个 UX 问题：为什么静默截断会侵蚀用户信任
当 LLM 为了给新 Token 腾出空间而静默丢弃早期的上下文时，用户看不到错误提示 —— 他们看到的是一个困惑的 AI。这是一个产品设计上的失败，而非模型本身的失败。
insiderai
5月4日9 min
上下文窗口是一个 API 界面：像对待合约一样对待你的提示词结构
为什么将上下文窗口布局视为正式的 API 合约——通过命名槽位、版本控制和 Diff 友好结构——能使 LLM 系统更易于调试和维护。
insiderprompt-engineering
5月4日11 min
对话感知的速率限制：为什么逐请求限流会破坏多轮 AI
逐请求 API 限流将每次对话轮次视为独立调用，但一个 10 轮的调试会话在架构上是一个完整任务。会话预算、语义去重和优雅降级才是正确的原语——原因如下。
rate-limitingllm
5月4日11 min

较新的博文

较旧的博文

Page 54

AI产品的暗能量：没人预算过的后台计算

为什么你的应用日志无法还原 AI 决策

构建信任修复流程：当你的 AI 犯下显而易见的错误后该怎么办

平庸 AI 宣言：为什么单个提示词的表现优于你的自主智能体

面向 Agent 与 RAG 的分块：为什么一套方案会同时拖累两者

代码所有权衰减：当 AI 编写大部分提交时，团队知识会发生什么

复合幻觉问题：多阶段 AI 流水线如何放大错误

上下文压缩失真：你的摘要中间件在悄悄丢失什么

上下文长度军备竞赛：为什么填满窗口是错误的目标

上下文限制是一个 UX 问题：为什么静默截断会侵蚀用户信任

上下文窗口是一个 API 界面：像对待合约一样对待你的提示词结构

对话感知的速率限制：为什么逐请求限流会破坏多轮 AI

关于 Tian Pan