博客

Page 59

12 articles

超时感知的智能体设计：如何返回部分结果而非静默失败
大多数 AI 智能体在触达截止时间时会完全失败。本文介绍如何设计能够返回当前最优结果而非什么都不返回的智能体。
insideragents
5月4日11 min
AI 驱动的 API 产品 Token 经济学：如何为不可预测的成本定价
在波动的 LLM 成本面前，按席位和按查询定价的模式都已失效。本文将探讨如何为 AI 驱动的 API 产品设计混合定价方案、Token 预算以及毛利计算逻辑。
insiderllm
5月4日12 min
规模化工具发现：为何纯嵌入检索在超过 20 个工具后开始失效
当AI智能体的工具库超过20个后，平面嵌入检索就会崩溃。本文解析其失败原因、结构化能力元数据的形态，以及分层路由器如何解决更好的工具描述无法修复的架构问题。
insiderai-agents
5月4日11 min
工具输出 Schema 设计：你的工具响应如何塑造智能体推理
糟糕的工具输出 schema 会导致智能体推理失败，表面上看像是模型问题。本文提供字段命名、可空性、冗余性、错误设计以及输出契约测试的实用指南。
llm-agentstool-use
5月4日9 min
AI 内容过滤器的双边成本：过度拒绝同样是业务问题
AI 内容过滤器通常被调整为尽量减少漏报，同时忽视误报——但拦截合法用户同样有可量化的业务损失。本文介绍如何正确校准这两类错误。
content-moderationai-safety
5月4日10 min
向量数据库分片：HNSW为何在分区边界失效及应对策略
HNSW图在分区方式上存在特殊阻力，会在大规模场景下导致无声的召回率下降。本文深入探讨其失效原因、实际中召回率损失的表现，以及团队在超出单节点容量后用于恢复检索精度的运营模式。
insidervector-database
5月4日10 min
责任转移问题：为什么AI会为它从未被设计独自做出的决策背锅
当AI辅助决策出错时，组织往往将矛头指向AI——但AI从未批准任何事情。本文解析生产系统中责任转移的成因，以及能够防止它发生的设计模式。
ai-engineeringproduct
5月3日12 min
为什么 AI 编程工具放大了初级工程师的产出却让资深工程师陷入瓶颈
AI 编程工具能为初级工程师带来 27–39% 的生产力提升，但在处理复杂任务时却使经验丰富的开发者变慢了 19%。本文将探讨这种差距产生的原因，以及资深工程师需要做出哪些改变。
insiderai-engineering
5月3日11 min
提示词即配置：像对待生产基础架构一样管理 AI 设置
大多数团队会在生产环境中追踪每一个环境变量，但却听任提示词、采样参数和工具模式（tool schemas）在没有版本控制的情况下发生偏移。本文将探讨为什么 AI 配置比环境变量更脆弱，以及如何以同样的严谨性来管理它们。
insiderllm
5月3日11 min
AI 内容漂移：当你的文档语料库开始自相矛盾时
AI 生成的文档会随着模型更新、提示词演变和语料库增长，悄悄地自相矛盾。本文分析漂移是如何积累的、为什么是用户而非编辑先发现问题，以及如何构建真正可规模化的一致性审计体系。
insiderai-documentation
5月3日11 min
AI 降级设计是架构问题，不是事后补丁
大多数 AI 功能只为顺利路径而设计。降级方案往往在第一次生产事故后才被临时拼凑——如果有的话。以下是如何在写第一个 prompt 之前就把这个问题解决掉。
ai-engineeringsystem-design
5月3日9 min
AI 文档债：随机系统是如何破坏你的技术知识库的
AI 功能文档的腐化速度比任何其他技术债都要快 —— 而且其方式往往令团队措手不及。本文将探讨为什么确定性的文档模式在概率系统中会失效，以及你应该转而编写什么样的内容。
ai-engineeringllm
5月3日11 min

较新的博文

较旧的博文

Page 59

超时感知的智能体设计：如何返回部分结果而非静默失败

AI 驱动的 API 产品 Token 经济学：如何为不可预测的成本定价

规模化工具发现：为何纯嵌入检索在超过 20 个工具后开始失效

工具输出 Schema 设计：你的工具响应如何塑造智能体推理

AI 内容过滤器的双边成本：过度拒绝同样是业务问题

向量数据库分片：HNSW为何在分区边界失效及应对策略

责任转移问题：为什么AI会为它从未被设计独自做出的决策背锅

为什么 AI 编程工具放大了初级工程师的产出却让资深工程师陷入瓶颈

提示词即配置：像对待生产基础架构一样管理 AI 设置

AI 内容漂移：当你的文档语料库开始自相矛盾时

AI 降级设计是架构问题，不是事后补丁

AI 文档债：随机系统是如何破坏你的技术知识库的

关于 Tian Pan