博客

Page 80

12 articles

正确的 Prompt 版本管理：将 LLM 指令视为生产软件
大多数团队把 prompt 当配置文件来对待——直到三个词的修改摧毁了一个创收工作流。这里是防止此类问题的工程纪律。
llmprompt-engineering
4月19日9 min
零样本、少样本还是思维链：生产环境下的决策框架
大多数团队根据习惯选择提示词策略。本文提供了一套基于证据的标准——包括任务复杂度、模型规模、Token 预算和输出结构——用于预测哪种方法在你的特定任务中表现最佳。
llmprompting
4月19日11 min
RAG知识库新鲜度：团队最后才解决的数据陈旧问题
分块策略和嵌入质量主导了RAG架构讨论，但索引新鲜度才是决定系统长期可靠性的核心。本文介绍如何检测、度量并修复这一问题。
insiderrag
4月19日12 min
RAG 位置偏差：为什么分块顺序会影响你的答案
检索正确性还不够——你的分块出现在提示词中的位置决定了模型实际使用哪些内容。本文探讨生产环境 RAG 系统中位置偏差的工作原理及应对方法。
insiderrag
4月19日9 min
测试检索-生成接缝：RAG 系统中的集成测试盲区
检索器和生成器的单元测试都能通过，但你的 RAG 系统却在悄悄失效。本文讲解如何测试两者之间的接缝，以及故障发生时如何定位责任归属。
insiderrag
4月19日12 min
RBAC 对 AI Agent 来说还不够：一种实用的授权模型
当 Agent 在任务执行过程中切换权限时，静态的基于角色的访问控制（RBAC）就会失效。本文将介绍如何构建一个真正有效的授权模型：狭窄的工具范围、短期凭据、ABAC 运行时策略以及锚定在 Agent 身份上的审计轨迹。
insiderai-agents
4月19日13 min
推理模型经济学：思维链何时物有所值
深度思考模型的单次查询成本高出 10–50 倍。本文提供了一套任务分类法，告诉你何时这笔溢价是值得的，以及如何构建自动应用该策略的路由架构。
insiderllm
4月19日11 min
重排序器（Reranker）鸿沟：为什么大多数 RAG 流水线忽略了最重要的一层
大多数 RAG 流水线在向量相似性搜索之后就停止了，并疑惑为什么准确率停滞不前。重排序器（Reranker）就是那层缺失的关键——本文将探讨跳过它的代价，以及如何判断这种权衡是否值得。
ragretrieval
4月19日11 min
串行工具调用瀑布：Agent循环中隐藏的延迟税
Agent框架默认串行执行工具调用，即使这些调用在逻辑上相互独立，造成与N+1查询问题如出一辙的延迟级联。本文介绍如何识别并修复这一问题。
insiderai-agents
4月19日10 min
从影子模式到自动驾驶：AI功能自主性的准备框架
将AI从影子模式逐步推进到咨询、副驾驶和自动驾驶阶段，需要明确的质量门控和监控机制，而不仅仅是组织层面的勇气。这里是工程框架。
insiderai-engineering
4月19日11 min
无共享智能体：为水平可扩展性设计 AI 智能体
大多数 AI 智能体无法水平扩展，因为它们积累了将其绑定到单一机器的隐式状态。本文介绍解决这一问题的架构规范。
insideragent-architecture
4月19日13 min
六个月悬崖：为什么生产环境中的 AI 系统会在没有一行代码改动的情况下发生退化
你的 AI 功能在发布时表现优异，通过了所有测试。但六个月后，它在悄无声息中退化了 20–40% —— 而你的仪表盘却从未发出警告。本文将探讨这种情况发生的原因以及如何阻止它。
llmproduction
4月19日11 min

较新的博文

较旧的博文

Page 80

正确的 Prompt 版本管理：将 LLM 指令视为生产软件

零样本、少样本还是思维链：生产环境下的决策框架

RAG知识库新鲜度：团队最后才解决的数据陈旧问题

RAG 位置偏差：为什么分块顺序会影响你的答案

测试检索-生成接缝：RAG 系统中的集成测试盲区

RBAC 对 AI Agent 来说还不够：一种实用的授权模型

推理模型经济学：思维链何时物有所值

重排序器（Reranker）鸿沟：为什么大多数 RAG 流水线忽略了最重要的一层

串行工具调用瀑布：Agent循环中隐藏的延迟税

从影子模式到自动驾驶：AI功能自主性的准备框架

无共享智能体：为水平可扩展性设计 AI 智能体

六个月悬崖：为什么生产环境中的 AI 系统会在没有一行代码改动的情况下发生退化

关于 Tian Pan