博客

Page 132

12 articles

大规模语料库策展：为什么你的 RAG 质量上限取决于你的文档质量下限
大多数 RAG 失败并不是模型故障，而是数据故障。本文探讨文档质量如何决定你的检索上限，以及在生产环境中语料库卫生究竟意味着什么。
insiderrag
4月13日12 min
AI 系统的数据溯源：追踪答案来源已成为工程必修课
当你的 LLM 在生产环境中给出错误答案时，你能追溯到底是哪些文档导致了这个结果吗？如果不能，你已经落后了。本文介绍如何从第一天起就将来源血缘嵌入 AI 系统。
insiderai-engineering
4月13日11 min
你的 LLM 评估套件中的古德哈特定律：当优化分数破坏系统时
团队如何在无意中博弈自己的 LLM 评估，为什么基准分数与生产质量的偏差比你预期的更快，以及保持评估套件诚实的元评估实践。
evaluationllm
4月13日10 min
混合 LLM 工作负载的 GPU 调度：那个没人解决好的装箱问题
在共享 GPU 集群上服务多个 LLM 模型会浪费 30–50% 的可用算力。本文解析 Kubernetes GPU 调度为何不适用于 LLM 推理，以及真正有效的解决方案。
insiderllm
4月13日12 min
制度性知识流失：AI Agent 如何在不传递理解的情况下吸收决策
当 AI Agent 端到端地处理任务时，曾经通过人类对话流转的推理过程停止了流动。本文探讨了这对工程团队造成的代价，并提供了具体的模式，在流失加剧之前阻止它。
insiderai-agents
4月13日11 min
为什么你的数据库在AI功能上线后崩溃：LLM感知的连接池设计
AI功能会产生突发性的长时间运行查询模式，耗尽为可预测Web流量设计的连接池。连接池分段、准入控制和'在LLM调用前释放连接'模式可以防止AI工作负载挤占核心产品资源。
insiderdatabase
4月13日10 min
机器可读的项目上下文：为什么你的 CLAUDE.md 比模型选择更重要
每款 AI 编程工具在响应之前都会读取一个项目专属的 Markdown 文件。这个文件的质量比背后的模型更可靠地预测输出质量——然而大多数团队只写一次、写得很糟，然后再也不碰。
insiderai-engineering
4月13日9 min
MCP 就是新一代的微服务：AI 工具生态正在重蹈分布式系统的覆辙
已有超过 16,000 个 MCP 服务器上线且仍在增长——这与 2016 年微服务泛滥的场景如出一辙。本文提供了一份实用指南，涵盖失败模式、网关模式和成熟度模型，帮助防止你的 AI 工具层变成下一个'死星'。
insidermcp
4月13日9 min
衡量真实的 AI 编程生产力：能在 90 天滞后期中幸存的指标
速度代理指标在第 30 天时看起来非常诱人，但在第 90 天时却与代码质量背道而驰。本文探讨了那些能够揭示 AI 编程工具究竟是在复利生产力，还是仅仅将债务转移到下游的滞后指标与领先信号。
insiderai-engineering
4月13日10 min
幽灵工具调用：当AI智能体调用不存在的工具
LLM智能体有时会凭空捏造工具调用——调用不存在的函数，并配上看似合理的参数。本文解释为什么会发生这种情况、五种失败类别，以及在幽灵调用破坏工作流之前捕获它们的运行时防御模式。
ai-agentsllm
4月13日9 min
质量感知模型路由：为什么仅优化成本会毁掉你的 AI 产品
仅优化成本的 LLM 路由虽然省钱，但会悄悄降低最重要查询的质量。本文提供按任务复杂度、模型能力和生产反馈进行路由的实用指南——而不仅仅是按每 token 价格。
ai-engineeringllm
4月13日11 min
当数据库迁移悄然摧毁 AI Agent 的世界模型
一次常规的列重命名可能在不触发任何告警的情况下悄悄破坏 AI Agent 的推理。Schema-Prompt 契约测试和 CI 门禁如何在用户发现之前捕获这种漂移。
insiderai-agents
4月13日10 min

较新的博文

较旧的博文

Page 132

大规模语料库策展：为什么你的 RAG 质量上限取决于你的文档质量下限

AI 系统的数据溯源：追踪答案来源已成为工程必修课

你的 LLM 评估套件中的古德哈特定律：当优化分数破坏系统时

混合 LLM 工作负载的 GPU 调度：那个没人解决好的装箱问题

制度性知识流失：AI Agent 如何在不传递理解的情况下吸收决策

为什么你的数据库在AI功能上线后崩溃：LLM感知的连接池设计

机器可读的项目上下文：为什么你的 CLAUDE.md 比模型选择更重要

MCP 就是新一代的微服务：AI 工具生态正在重蹈分布式系统的覆辙

衡量真实的 AI 编程生产力：能在 90 天滞后期中幸存的指标

幽灵工具调用：当AI智能体调用不存在的工具

质量感知模型路由：为什么仅优化成本会毁掉你的 AI 产品

当数据库迁移悄然摧毁 AI Agent 的世界模型

关于 Tian Pan