博客

Page 142

12 articles

保修难题：当你的 AI 功能出错时，谁来买单？
软件保修历来假设确定性行为——AI 功能打破了这一假设。本文为工程团队提供了一份实用指南，帮助理解在交付非确定性系统时面临的责任、保险和合同缺口。
insiderai-liability
4月11日10 min
当你的智能体意见不一致时：多智能体系统中的共识与仲裁
如何在没有标准答案的情况下解决对等 AI 智能体之间的输出冲突 —— 内容涵盖多数投票、置信度加权、裁判模型，以及何时应该向用户展示分歧而非将其隐藏。
insidermulti-agent
4月11日15 min
AI Agent 的预写日志：借鉴数据库恢复模式实现崩溃安全执行
数据库 WAL 模式可以直接映射到 AI Agent 工作流——在执行动作前记录意图、在推进前记录结果的执行日志，能够实现跳过重放恢复、精确一次副作用以及崩溃后的确定性恢复。
insiderai-agents
4月11日11 min
能力探测：在用户发现之前绘制模型的能力边界
通过探针套件、能力矩阵、金丝雀提示词以及探针到回归的流水线，在部署前绘制 LLM 的失败边界，在模型升级中捕获静默回归。
llm-testingcapability-probing
4月10日11 min
赵长鹏《币安人生》逐章解读：从江苏少年到加密帝国的 25 章人生
逐章解读赵长鹏自传《币安人生》（Freedom of Money），从江苏乡村到加拿大移民，从华尔街程序员到创立全球最大加密货币交易所，再到认罪入狱与重获自由 —— 25 章完整梳理。
cryptobiography
4月10日42 min
隐藏的 Token 税：系统开销如何悄无声息地耗尽你的 LLM 上下文窗口
在用户内容到达之前，系统提示词、工具 Schema 和聊天历史就已悄悄消耗了你 30-60% 的 LLM 上下文窗口 —— 本文将介绍如何审计并削减这些系统开销。
insiderllm-optimization
4月10日10 min
无限机器：戴密斯·哈萨比斯如何缔造 DeepMind 并追寻 AGI
从国际象棋神童到诺贝尔奖共同得主，戴密斯·哈萨比斯将 DeepMind 打造成了全球最具野心的 AI 研究实验室。塞巴斯蒂安·马拉比的传记追溯了追寻通用人工智能背后的科学突破、企业博弈和生存困境。
insiderai
4月10日185 min
准确率阈值难题：当你的 AI 功能好到无法忽视却又差到无法信任
以 70-85% 的准确率部署 AI 功能会创造一个极其危险的区域：它好到足以吸引用户习惯性地使用，但又差到会产生明显的错误，从而导致用户信任崩塌。本文将结合研究成果，探讨为什么这个区域如此危险，以及你该如何通过设计走出这一困境。
ai-engineeringreliability
4月9日11 min
对抗性智能体监控：构建无法被规避的监管机制
单层 LLM-as-judge 监控在面对复杂智能体时，失效概率超过 52%。本文介绍了在生产环境中行之有效的四层防御栈：行为指纹识别、动作审计、多监控器共识以及工具层约束。
insiderai-agents
4月9日12 min
为什么智能体成本预测已经失效 —— 以及我们该如何应对
传统的成本预测在 AI 智能体上宣告失败，因为执行路径是随机的，而非确定性的。学习决策环路成本建模、蒙特卡罗模拟以及能让智能体支出变得可预测的护栏模式。
ai-agentsfinops
4月9日12 min
Agent 友好型 API：当 AI 成为客户端时，后端工程师常犯的错误
当 AI Agent 成为客户端时，大多数 REST API 都会在无声中崩溃 —— 模糊的错误会导致重试循环，偏移分页会破坏遍历，而基于请求数的速率限制在多 Agent 协作下会失效。本文将介绍需要修复的问题及其重要性。
insiderapi-design
4月9日13 min
智能体幂等性：为什么你的 AI Agent 会发送两次邮件
生产环境中的 AI Agent 会重试失败的工具调用——这会导致重复付款、重复邮件以及重复的现实世界操作。本文介绍了来自分布式系统的四种经受过实战检验的模式，让智能体副作用的重试变得安全可靠。
ai-agentidempotency
4月9日11 min

较新的博文

较旧的博文

Page 142

保修难题：当你的 AI 功能出错时，谁来买单？

当你的智能体意见不一致时：多智能体系统中的共识与仲裁

AI Agent 的预写日志：借鉴数据库恢复模式实现崩溃安全执行

能力探测：在用户发现之前绘制模型的能力边界

赵长鹏《币安人生》逐章解读：从江苏少年到加密帝国的 25 章人生

隐藏的 Token 税：系统开销如何悄无声息地耗尽你的 LLM 上下文窗口

无限机器：戴密斯·哈萨比斯如何缔造 DeepMind 并追寻 AGI

准确率阈值难题：当你的 AI 功能好到无法忽视却又差到无法信任

对抗性智能体监控：构建无法被规避的监管机制

为什么智能体成本预测已经失效 —— 以及我们该如何应对

Agent 友好型 API：当 AI 成为客户端时，后端工程师常犯的错误

智能体幂等性：为什么你的 AI Agent 会发送两次邮件

关于 Tian Pan