博客

Page 138

12 articles

能力激发：让大语言模型用好它已知道的一切
大多数提示优化聚焦于指令清晰度，但真正的瓶颈往往在于知识激活。从专家身份框架到顺序分解，五种激发技术能够解锁模型的潜在能力——这是单纯优化指令无法企及的。
llmprompt-engineering
4月11日10 min
能力激发 vs. 提示工程：让模型调用它已经掌握的知识
为什么大多数提示词优化都在解决错误的问题——以及结构化分解、类比启动和失败分类如何释放模型的潜在能力，而这些是单纯调整指令措辞永远无法触达的。
llmprompt-engineering
4月11日9 min
中心化 AI 平台陷阱：为什么共享 ML 团队会扼杀产品速度
建立共享 ML 基础设施团队听起来是正确的做法。但实践中，它往往成为交付 AI 功能的最大瓶颈。以下是问题所在，以及应该怎么做。
ai-engineeringmlops
4月11日9 min
AI Agent 的混沌工程：在生产环境之前注入你的 Agent 将真正面对的故障
LLM API 调用在生产环境中有 1-5% 的失败率。对于每个任务需要进行数十次工具调用的多步骤 Agent，未经测试的故障模式会变成面向客户的 bug。本文提供故障注入类别、框架设计和基准测试结果的实用指南，帮助构建弹性 AI Agent。
insiderchaos-engineering
4月11日11 min
多 Agent 决策的共识协议：当你的 Agent 意见不一致时会发生什么
LLM Agent 之间的多数投票在有争议的问题上几乎有 24% 的失败率。分布式系统原语——领导者选举、法定人数投票和 CRDT——为协调多 Agent 决策提供了经过实战检验的替代方案。
multi-agentdistributed-systems
4月11日10 min
上下文窗口即 IDE：AI 编程智能体成败的关键在于它能看到什么
METR 研究发现，有经验的开发者在使用 AI 编程工具时反而慢了 19%——瓶颈在于上下文检索，而非模型能力。检索质量、项目记忆文件和即时上下文模式决定了 AI 编程智能体究竟是提升还是拖累生产力。
context-engineeringai-coding-agents
4月11日10 min
AI 系统的康威定律：你的组织架构图就是你的 Agent 架构
为什么多 Agent AI 系统映射的是组织架构图而非技术架构图——以及那些防止 Agent 边界继承团队功能障碍的组织模式（嵌入式 AI 工程师、共享评估基础设施、Prompt 审查实践）。
insiderconways-law
4月11日10 min
深度研究智能体：为什么大多数实现要么无限循环，要么过早停止
生产环境中的深度研究智能体往往要么因追逐无关分支而空耗 Token，要么在两次查询后就草草收场。本文将探讨实用的收敛策略、成本控制、可信度防御以及让迭代搜索真正奏效的架构模式。
ai-agentsdeep-research
4月11日11 min
确定性重放：如何调试永远不会以相同方式运行两次的 AI Agent
记录 Agent 执行期间的每个 LLM 调用、工具响应和时间戳，然后重放精确序列来复现故障——因为把 temperature 设为零并不能让你的多步 Agent 变得确定性。
ai-agentsdebugging
4月11日12 min
AI 系统中的差分隐私：'我们添加了噪声'究竟意味着什么
声称使用差分隐私与真正约束模型记忆和输出之间的差距——关于 epsilon 预算、DP-RAG 权衡以及 DP 训练何时完全不适用的实用指南。
insiderai-engineering
4月11日13 min
动态少样本检索：为什么你的静态示例正在损耗准确率
静态少样本示例看起来很安全，但它们会悄无声息地降低大多数请求的质量。本文从工程角度阐述动态检索的必要性——以及团队在迁移过程中常踩的坑。
llmprompting
4月11日12 min
你的 Embedding 流水线是关键基础设施——请像对待主数据库一样对待它
生产环境中的 embedding 流水线会悄无声息地出故障——在不触发任何告警的情况下返回看似合理却错误的结果。本文介绍 CDC 到 embedding 的架构、模型迁移策略以及监控体系，帮助你的向量索引达到与主数据库同等级别的可靠性。
embeddingsvector-databases
4月11日11 min

较新的博文

较旧的博文

Page 138

能力激发：让大语言模型用好它已知道的一切

能力激发 vs. 提示工程：让模型调用它已经掌握的知识

中心化 AI 平台陷阱：为什么共享 ML 团队会扼杀产品速度

AI Agent 的混沌工程：在生产环境之前注入你的 Agent 将真正面对的故障

多 Agent 决策的共识协议：当你的 Agent 意见不一致时会发生什么

上下文窗口即 IDE：AI 编程智能体成败的关键在于它能看到什么

AI 系统的康威定律：你的组织架构图就是你的 Agent 架构

深度研究智能体：为什么大多数实现要么无限循环，要么过早停止

确定性重放：如何调试永远不会以相同方式运行两次的 AI Agent

AI 系统中的差分隐私：'我们添加了噪声'究竟意味着什么

动态少样本检索：为什么你的静态示例正在损耗准确率

你的 Embedding 流水线是关键基础设施——请像对待主数据库一样对待它

关于 Tian Pan