博客

Page 48

12 articles

解释债务：为什么用户有权知道你的AI做了什么
团队花费数月优化AI输出质量，却在没有解释层的情况下上线——本文分析了这一选择所积累的代价，以及能够解决问题的轻量级归因模式、置信度信号和申诉机制。
insiderai-engineering
5月6日9 min
反馈信号时序问题：为何你的 AI 指标正在欺骗你
点赞/踩和 CSAT 评分往往与 AI 产品的长期价值背道而驰。本文介绍如何构建真正能捕捉核心价值的度量体系。
insiderai
5月6日10 min
基于模型性能而非用户分群的 AI 功能灰度控制
传统的特性标志（feature flags）基于用户分群进行控制 —— 但 AI 质量故障会同时影响所有人，且永远不会触发错误警报。本文将介绍基于性能条件的门控如何解决这一问题。
llmopsfeature-flags
5月6日11 min
渐进式上下文替换：在长 AI 对话中保持质量的方法
硬截断和朴素摘要在长 AI 对话中都会导致质量下降。滚动替换模式——对近期轮次保持原始状态，同时对较旧内容进行增量压缩——是在会话超过四十轮时保持质量的有效方法。
insiderai-engineering
5月6日9 min
你的帮助中心在 AI 功能方面缺失了什么（以及为什么用户不断提交工单）
传统的“操作指南”在面对 AI 功能时往往会失效，因为它们假设行为是确定性的。这里有一些能够切实减少支持工单的文档格式 —— 包括能力展示馆、局限性章节和变异示例。
insiderai-documentation
5月6日12 min
好帮手 AI 的悖论：为什么遵循指令是一个安全漏洞
让大语言模型（LLM）变得好用的“顺从性”，同时也让它们变得易受攻击。本文将探讨提示词注入攻击背后的工程现实、真实世界的漏洞案例，以及哪些防御措施能真正降低风险。
insidersecurity
5月6日12 min
HIPAA、SOC2 与你的智能体：合规性对架构产生的实际约束
大多数 AI 团队在审计时才发现合规要求，而不是在第一个迭代周期。本文将探讨 HIPAA 和 SOC2 在架构上的实际要求，以及三个你无法在后期补救的关键决策。
insiderai-engineering
5月6日14 min
人工接管作为一等功能：设计能够优雅降级至人工控制的 AI 系统
大多数 AI 系统将人工接管视为错误状态，而非设计模式。以下是如何将接管协议构建为一等操作路径而非事后补救的方法。
insiderai-engineering
5月6日11 min
隐形作者问题：当 AI 编写大部分代码时如何进行 Git Blame
当 46% 的代码由 AI 生成且不包含溯源元数据时，git blame 止步于一位接受了自己可能并不理解的建议的开发者。本文探讨了哪些环节会出现问题，以及团队正在采取什么应对措施。
ai-engineeringcode-review
5月6日9 min
LLM-as-Judge 的对抗性失效：当你的评测框架被操控
一个输出固定回复的「空模型」在 AlpacaEval 上拿下了 86.5% 的胜率。本文系统梳理 LLM 评测框架被操控的方式、其内在的结构性偏差，以及让评测流水线保持诚实的审计方案。
insiderevaluation
5月6日10 min
你的负载测试在撒谎：生产环境中的 LLM 供应商容量争用
LLM API 是多租户共享基础设施 —— 你的负载测试在凌晨 2 点通过，但生产环境的延迟在周二上午 9 点却出现飙升。了解共享峰值需求的机制以及保护你 SLO 的架构模式（多供应商对冲、熔断器、预留容量）。
llmproduction
5月6日13 min
LLM 自我调试：解释何时是信号，何时是谎言
LLM 在被问到失败原因时会给出流畅的回答——但这个解释和实际的失败机制往往是两回事。本文是一份实践指南，帮助你在采取行动之前分辨两者的区别。
llmdebugging
5月6日9 min

较新的博文

较旧的博文

Page 48

解释债务：为什么用户有权知道你的AI做了什么

反馈信号时序问题：为何你的 AI 指标正在欺骗你

基于模型性能而非用户分群的 AI 功能灰度控制

渐进式上下文替换：在长 AI 对话中保持质量的方法

你的帮助中心在 AI 功能方面缺失了什么（以及为什么用户不断提交工单）

好帮手 AI 的悖论：为什么遵循指令是一个安全漏洞

HIPAA、SOC2 与你的智能体：合规性对架构产生的实际约束

人工接管作为一等功能：设计能够优雅降级至人工控制的 AI 系统

隐形作者问题：当 AI 编写大部分代码时如何进行 Git Blame

LLM-as-Judge 的对抗性失效：当你的评测框架被操控

你的负载测试在撒谎：生产环境中的 LLM 供应商容量争用

LLM 自我调试：解释何时是信号，何时是谎言

关于 Tian Pan