博客

Page 129

12 articles

氛围编程有害论：当 AI 辅助的速度扼杀软件质量
AI 编码工具承诺速度，却带来理解债务——有经验的开发者使用 AI 后效率降低 19%，生成的代码问题多 1.7 倍，76% 的开发者会发布自己不完全理解的代码。
insiderai-coding
4月12日9 min
对非确定性 AI 功能进行 A/B 测试：为何你的实验框架假设了错误的零假设
标准 A/B 测试框架假设处理是确定性的，但 LLM 驱动的功能会引入处理内方差，从而破坏功效计算、膨胀样本量并产生不可靠的结果。本文为非确定性 AI 实验提供随机化、指标设计、贝叶斯方法和方差缩减的实践指南。
insiderab-testing
4月11日12 min
抽象反转问题：当 AI 框架迫使你在错误的层级思考
大多数 AI Agent 框架承诺提升速度，却带来了锁定。本文介绍抽象反转问题如何困住团队，为什么 AI 抽象比传统抽象泄漏得更快，以及生产团队最终收敛的架构模式。
ai-frameworksagent-architecture
4月11日10 min
智能体凭据轮换：尚未被映射到 AI 领域的 DevOps 难题
自主 AI 智能体在工具集成中积累了大量长期存在的密钥，而传统的轮换策略往往会在任务执行中途导致其中断。四种架构模式——即时置备、双重刷新、工具与运行时隔离以及连接器抽象——能够确保智能体在凭据生命周期内安全运行。
insiderai-agents
4月11日9 min
智能体死锁：当 AI 代理永远在等待彼此
多智能体 AI 系统在代理同时协调时，死锁率在 25% 到 95% 之间——这直接呼应了经典分布式系统的故障模式。实用的检测和预防模式，防止生产环境中的代理工作流冻结。
multi-agent-systemsdeadlock
4月11日10 min
AI 辅助故障响应：为你的值班 Agent 提供运维手册
尽管 AI 投资创下纪录，但由于团队在部署 Agent 时缺乏运维手册或防护栅栏，运维负担反而有所增加。通过采用三层自治模型 —— 咨询型、审批型、条件型 —— 结合结构化运维手册和爆炸半径检查，可以将 AI Agent 转化为可靠的值班伙伴。
incident-responsesre
4月11日11 min
没有人正确衡量的 AI 功能采用曲线
DAU 和会话时长掩盖了用户是真正采用 AI 功能还是仅仅在容忍它们。了解揭示真实采用情况的行为信号——编辑接受比、绕过率、覆盖时间——以及捕获这些信号的埋点架构。
insiderai-adoption
4月11日10 min
AI 功能计费是一个没人预先规划的工程问题
为什么按席位和按查询定价模式在智能体 AI 产品中行不通，如何构建从 API 调用到客户账单的成本归因栈，以及在财务团队发现之前就能告诉你哪些 AI 功能处于亏损状态的利润率计算方法。
ai-engineeringcost-optimization
4月11日10 min
AI 功能自相残杀：当你的智能功能悄悄杀死核心产品
自动化关键工作流步骤的 AI 快捷方式可能会悄然侵蚀参与循环、降低产品粘性，并将你的产品变成一个商品化的包装层——以下是检测和预防的方法。
insiderai-product-strategy
4月11日11 min
AI 演示跳过的五个关卡：LLM 功能发布就绪清单
为什么“演示效果很好”是 LLM 功能最糟糕的发布标准，以及每个 AI 团队在发布前必须通过的五个生产就绪关卡。
insiderllm
4月11日14 min
AI 融入 SRE 循环：哪些有效、哪些失效，以及边界在哪里
LLM 可将 MTTR 缩短 40-70%，并在数分钟内自动生成故障复盘报告 —— 但凌晨三点一个自信却错误的诊断，远比聊天机器人出错危险得多。本文从实战角度拆解 AI 在哪些环节真正增强故障响应、在哪些场景自主行动会适得其反，以及决定最终结果的关键架构决策。
aisre
4月11日12 min
没人用的 AI 产品指标：超越准确率，走向用户价值信号
工程团队执迷于准确率和延迟，而真正预测 AI 产品成败的指标——任务完成率、编辑率、会话深度——却无人度量。本文介绍如何为用户价值构建埋点体系。
ai-engineeringproduct-metrics
4月11日10 min

较新的博文

较旧的博文

Page 129

氛围编程有害论：当 AI 辅助的速度扼杀软件质量

对非确定性 AI 功能进行 A/B 测试：为何你的实验框架假设了错误的零假设

抽象反转问题：当 AI 框架迫使你在错误的层级思考

智能体凭据轮换：尚未被映射到 AI 领域的 DevOps 难题

智能体死锁：当 AI 代理永远在等待彼此

AI 辅助故障响应：为你的值班 Agent 提供运维手册

没有人正确衡量的 AI 功能采用曲线

AI 功能计费是一个没人预先规划的工程问题

AI 功能自相残杀：当你的智能功能悄悄杀死核心产品

AI 演示跳过的五个关卡：LLM 功能发布就绪清单

AI 融入 SRE 循环：哪些有效、哪些失效，以及边界在哪里

没人用的 AI 产品指标：超越准确率，走向用户价值信号

关于 Tian Pan