博客

Page 45

12 articles

智能体记忆漂移：为什么一致性对齐是你缺失的关键环
长期运行的智能体在停止观察的那一刻起就与世界脱节。应将记忆视为数据库副本：使用水位线 (watermarks)、变更摘要 (change feeds) 和惰性重校验。
insiderai-agents
4月26日12 min
无真值情况下的智能体 SLO：为无法实时评分的输出建立错误预算
传统的 SRE 实践为你提供了与用户满意度直接挂钩的可用性和延迟目标。但智能体（Agentic）特性打破了这种映射。本文将介绍当“成功”在请求发出数小时后才出现时，该如何编写错误预算——以及为什么照搬延迟 SLO 手册的团队虽然能完成每个季度的目标，却眼睁睁看着用户流失。
insiderai-engineering
4月26日13 min
30 秒都去哪了：APM 无法察觉的 Agent 步骤内部延迟归因
传统的 APM 将 Agent 的一个步骤视为单一的粗粒度 Span，导致值班工程师只能靠猜。通过将其分解为七个阶段，区分首字延迟 (Prefill) 与解码 (Decode)，并追踪关键路径而非总 Span 时间。
insiderobservability
4月26日13 min
智能体流量不等同于人类流量：为两类调用者设计 API
生产环境的 API 现在正在服务两类调用者——人类和智能体。它们具有不同的流量特征、故障模式和安全风险。在 2026 年，将它们混为一谈是所有关于端点不稳定问题调查的根源。
api-designai-agents
4月26日13 min
Agent 撤销按钮是 Saga，而非栈
多工具 Agent 撤销本质上是一个伪装的 Saga 模式问题。预计算逆操作、残留 UX 和级联限制决定了撤销是会成功，还是会在 40% 的情况下静默失败。
insiderai-agents
4月26日11 min
Agent 工作流的碳计算：Token 预算现已成为 ESG 披露
Agent 工作流消耗的能量可能是单次对话补全的 50–200 倍，采购团队已经开始关注这一指标。本文是一份关于逐任务碳归因、碳预算强制要求的路由决策，以及为什么率先进行观测的团队能掌控话语权的务实指南。
insiderai-agents
4月26日12 min
AI 网络保险：你的智能体会首先发现的保障缺口
大多数网络保险和 E&O 保单是为数据泄露和程序漏洞设计的，而非针对使用你的凭证运行的智能体。这种保障缺口通常在理赔时才会显现，而那时往往没人提前为此做好规划。
insiderai-engineering
4月26日12 min
AI 工程师面试系统性失灵：停止考实现，开始考评测设计
Leetcode 筛选和系统设计环节是针对编写确定性代码的工程师进行校准的。AI 工程需要一种不同的信号 —— 能捕捉到这种信号的环节是评测设计，而非具体实现。
hiringai-engineering
4月26日11 min
为什么弃用 AI 功能比你想象的更难：用户构建了你看不见的信任脚手架
停止 AI 功能的服务不像停用 API。契约是模型被观察到的行为，用户会在其上构建不可见的脚手架，而这些脚手架会在切换时断裂。
insiderai-engineering
4月26日11 min
AI 功能与 OKR 的错位：为什么季度节奏会破坏 AI 路线图
季度 OKR 是为确定性软件校准的。AI 功能具有发布曲线和持续曲线，而将它们视为交付物的模板所产生的 Demo，在规划周期之间会逐渐退化。
ai-engineeringengineering-leadership
4月26日11 min
AI 功能的 RACI 模型：为什么四个绿色仪表盘组合在一起却是一个破碎的产品
每个生产环境中的 AI 功能都有四个交付物负责人，却没有人为集成的用户体验负责。这种差距正是接缝漏洞产生的原因——以及填补这一空白的组织设计修复方案。
ai-engineeringteam-structure
4月26日13 min
你不该上线的 AI 功能：任务形态错位核查清单
大多数 Demo 都能跑通。但在已上线的 AI 功能中，仍有相当一部分存在任务形态错位——即将随机性引擎强行接入需要确定性输出的场景。本文提供了一份开发前的核查清单以及路线图调整建议，帮助你重新引导那些不符合模型形态的创意。
ai-producteval
4月26日11 min

较新的博文

较旧的博文

Page 45

智能体记忆漂移：为什么一致性对齐是你缺失的关键环

无真值情况下的智能体 SLO：为无法实时评分的输出建立错误预算

30 秒都去哪了：APM 无法察觉的 Agent 步骤内部延迟归因

智能体流量不等同于人类流量：为两类调用者设计 API

Agent 撤销按钮是 Saga，而非栈

Agent 工作流的碳计算：Token 预算现已成为 ESG 披露

AI 网络保险：你的智能体会首先发现的保障缺口

AI 工程师面试系统性失灵：停止考实现，开始考评测设计

为什么弃用 AI 功能比你想象的更难：用户构建了你看不见的信任脚手架

AI 功能与 OKR 的错位：为什么季度节奏会破坏 AI 路线图

AI 功能的 RACI 模型：为什么四个绿色仪表盘组合在一起却是一个破碎的产品

你不该上线的 AI 功能：任务形态错位核查清单

关于 Tian Pan