博客

Page 100

12 articles

多智能体系统中的温度治理：为什么方差是一类预算
以相同的温度运行你的所有智能体组件，就像给它们设置相同的超时时间一样错误。本指南将介绍如何设计基于角色的采样策略，使输出方差与每个流水线阶段的实际需求相匹配。
insiderai-engineering
4月19日13 min
时间上下文注入：让 LLM 真正知道今天是几号
LLM 没有时钟。你发布的每一个日期敏感功能，默认都是坏的——除非你显式地注入时间上下文。本文介绍如何在不破坏提示缓存的前提下做到这一点。
llmproduction-ai
4月19日12 min
生产环境中的Text-to-SQL：自然语言查询为何在Schema边界失败
为什么Text-to-SQL的供应商演示效果完美，而生产部署却一团糟——以及真正能缩小这一差距的工程技术。
ai-engineeringllm
4月19日10 min
多轮工具调用的Token经济学：为什么你的Agent成本比你想象的高5倍
基于单次调用数学建立的Agent成本估算从设计上就是错误的。本文解释多轮工具调用如何以非线性方式复合Token成本——以及保持长任务Agent经济可行的具体设计杠杆。
insiderai-engineering
4月19日11 min
破坏生产级 LLM 系统的分词器盲点
为什么 “1000 个 Token ≈ 750 个单词” 的假设在最关键的情况下会失效：多语言文本、结构化输出和代码密集型工作负载 —— 以及随之而来的生产环境 Bug。
insiderllm
4月19日11 min
工具输出压缩：决定上下文质量的注入策略
AI智能体管道中的工具结果Token密度相差100倍。你选择的注入策略——原始注入、压缩还是提取——从根本上决定了智能体在规模化后的准确率上限、成本上限和延迟下限。
insiderllm-agents
4月19日11 min
上游数据质量是你 AI Agent 的真实瓶颈
生产环境中的大多数 AI Agent 故障并不是模型问题 —— 而是数据问题。本文将介绍如何诊断并修复那些即使进行再多提示词工程（Prompt Engineering）也无法解决的上游数据质量问题。
ai-agentsdata-quality
4月19日11 min
你的供应商模型卡没有告诉你的事
模型卡报告的是平均基准分数。它们遗漏了尾部行为、系统提示交互效果、文化盲点，以及那些悄悄破坏生产系统的静默回归。以下是各团队正在构建的替代方案。
insiderllm
4月19日11 min
规模化 Vibe 编程：当 AI 编写大部分代码库时如何管理技术债务
AI 生成的代码表面上合理，但隐藏着系统性缺陷，在第 12-18 个月会演变成危机级别的技术债务。以下是真正能预防这一问题的工程实践。
ai-engineeringtechnical-debt
4月19日10 min
Vibe Coding 的生产力瓶颈：为何 AI 带来的速度提升在三个月后开始回落
93% 的开发者在使用 AI 编程助手，但生产力的提升却停留在 10% 左右。本文探讨了这种复合失效模式——它如何将早期的速度优势转化为长期的拖累——以及预防这一现象的实践方法。
ai-engineeringproductivity
4月19日9 min
工作流引擎何时优于LLM智能体：确定性编排的决策框架
Gartner预测40%的智能体AI项目将在2027年前被取消。在默认选择自主LLM智能体之前，这里是一个选择确定性编排器的框架。
agent-architectureworkflow-orchestration
4月19日10 min
当处理方案不确定时如何对 AI 功能进行 A/B 测试
当你的处理方案是 LLM 时，标准 A/B 测试就会失效——输出因每次调用而异，模型更新在实验进行中途上线，而「成功」又难以被清晰量化。以下是使实验结果仍然可信的统计调整方法和实验模式。
experimentationllm
4月18日12 min

较新的博文

较旧的博文

Page 100

多智能体系统中的温度治理：为什么方差是一类预算

时间上下文注入：让 LLM 真正知道今天是几号

生产环境中的Text-to-SQL：自然语言查询为何在Schema边界失败

多轮工具调用的Token经济学：为什么你的Agent成本比你想象的高5倍

破坏生产级 LLM 系统的分词器盲点

工具输出压缩：决定上下文质量的注入策略

上游数据质量是你 AI Agent 的真实瓶颈

你的供应商模型卡没有告诉你的事

规模化 Vibe 编程：当 AI 编写大部分代码库时如何管理技术债务

Vibe Coding 的生产力瓶颈：为何 AI 带来的速度提升在三个月后开始回落

工作流引擎何时优于LLM智能体：确定性编排的决策框架

当处理方案不确定时如何对 AI 功能进行 A/B 测试

关于 Tian Pan