博客

Page 40

12 articles

AI 专家门诊无法规模化：当你的核心专家成为发布瓶颈
生产环境中的 AI 功能往往集中在某一位工程师的时间表上，这种瓶颈在所有仪表盘中都难以察觉，直到这位专家离职。本文将介绍如何识别并打破这种困局。
ai-engineeringengineering-leadership
4月27日11 min
你的 AI 定价页面是一场对 Token 经济学的杠杆押注
按席位定价的无限次 AI 套餐是对 Token 波动性的裸空。厂商调价、重度用户行为偏移以及模型配比的潜移默化，会瞬间挤压毛利——除非在页面上线前，就已内置好归因、用量限制和分层梯度。
ai-engineeringpricing
4月27日10 min
AI 风险登记簿：你的首席风险官在事故发生后的第二天会要求看什么
你的企业风险登记簿中有网络、供应商和监管相关的条目 —— 但没有关于那个刚刚利用你的凭证采取行动并导致客户可见损失的自主智能体的条目。以下是首席风险官（CRO）在事故发生后的第二天会要求的五个关键列。
ai-engineeringgovernance
4月27日13 min
AI 影子 IT：当产品团队构建自己的 LLM 代理时
影子 LLM 代理之所以会绕过成本归因、审计日志和数据处理协议 (DPA)，是因为平台网关在面对产品交付期限时败下阵来。解决办法是建立一条“铺好的路” (Paved Road)，在首 token 延迟 (TTFT)、功能对等和开发人员体验方面全面超越非官方渠道。
insiderai-platform
4月27日12 min
参数幻觉是漂移信号，而非模型 Bug
当模型虚构参数值时，成本最低的假设并不是“模型失败了”，而是“你提供给模型的描述与连接另一端的 API 不再匹配”。
llm-toolsagents
4月27日11 min
为什么你的偏见评估在 CI 中通过但在部署时失败
静态偏见审计在 CI 中通过但在生产环境中失败，是因为输入分布发生了偏移。解决方案是使用按队列设置的 SLO 和具备漂移感知的发布门控进行持续公平性监控。
fairnessevals
4月27日11 min
“换个更大的模型试试”这种直觉反应是一种重构异味
当你团队中出现的每一次质量退化都习惯性地转向“让我们换个更大的模型试试”时，你实际上是在投入昂贵的算力资源来掩盖上游的 bug。这种打破直觉反应的纪律，以及为此设立的门控机制至关重要。
insiderllm
4月27日12 min
浏览器原生 AI 是一项针对具体功能的决策：你的团队尚未权衡的四个维度
浏览器原生 AI 并非更快的 TensorFlow.js。它是一个具有四个维度权衡（延迟底线、隐私、设备碎片化、能力上限）的差异化运行时，无法简单归结为一个标准答案。
browser-aiwebgpu
4月27日14 min
置信度描述而非评分：为什么 0.87 的徽章无法打动任何人
一个 0.87 的置信度徽章不会改变任何用户行为。而一个说明模型未检查内容的自然语言对冲表述则能起到很大作用。本文探讨了为什么概率评分是错误形式的信号，以及如何将不确定性作为内容而非 UI 叠加层来发布。
insiderai-ux
4月27日12 min
单次正确成本，而非 Token 成本：账单不会告诉你的单位指标
Token 支出是分子，通过评估定级的产出是分母。仅仅追踪账单，往往会导致在向低成本方案迁移时，由于质量悄然下降而推高下游的支持成本。
ai-engineeringfinops
4月27日13 min
跨团队 Agent SLA 无法简单叠加：你的组织遗漏预算的 99% 数学陷阱
当 Agent 跨越团队边界互相调用时，单个 SLO 将不再能预测端到端的行为。在组合数学耗尽你的可靠性预算之前，必须落地的四个关键要素。
insidermulti-agent
4月27日13 min
Eval 瓶颈：你的 Eval 工程师现在就是路线图
在 2026 年，AI 功能的吞吐量限制不再是模型发布或 Prompt 迭代，而是 Eval 工程。这里有在你的唯一一名 Eval 工程师辞职之前，你所需了解的人员配比、平台投入和领导层认知重构。
evalsai-engineering
4月27日13 min

较新的博文

较旧的博文

Page 40

AI 专家门诊无法规模化：当你的核心专家成为发布瓶颈

你的 AI 定价页面是一场对 Token 经济学的杠杆押注

AI 风险登记簿：你的首席风险官在事故发生后的第二天会要求看什么

AI 影子 IT：当产品团队构建自己的 LLM 代理时

参数幻觉是漂移信号，而非模型 Bug

为什么你的偏见评估在 CI 中通过但在部署时失败

“换个更大的模型试试”这种直觉反应是一种重构异味

浏览器原生 AI 是一项针对具体功能的决策：你的团队尚未权衡的四个维度

置信度描述而非评分：为什么 0.87 的徽章无法打动任何人

单次正确成本，而非 Token 成本：账单不会告诉你的单位指标

跨团队 Agent SLA 无法简单叠加：你的组织遗漏预算的 99% 数学陷阱

Eval 瓶颈：你的 Eval 工程师现在就是路线图

关于 Tian Pan