博客

Page 76

12 articles

90% 可靠性之墙：为什么 AI 功能会陷入瓶颈以及该如何应对
为什么 AI 功能在可靠性达到 90% 左右时会停滞不前，如何诊断可减少误差与不可减少误差，以及能让你交付真实价值的产品架构决策。
ai-engineeringreliability
4月18日11 min
随机系统的值班响应：为何你的 AI 运行手册需要重写
传统故障响应假设故障是可复现的，但 LLM 驱动的系统并非如此。以下是如何针对非确定性 AI 重写告警方案、分类决策树和事后分析模板。
insiderai-engineering
4月18日12 min
没人讨论的端侧 LLM 问题：模型更新传播
将 LLM 部署到边缘设备会创建一个没有中央回滚机制的分布式系统——版本碎片化、无声的能力漂移，以及在基准测试中根本不会暴露的制品集合不匹配问题。
insideredge-ai
4月18日13 min
生产环境中的端侧 LLM 推理：何时选择边缘模型以及它们的实际成本
在 iOS、Android 和浏览器上运行 LLM 推理的隐私、延迟和离线优势——以及质量与体积的权衡、成本计算，以及在上线六个月后让团队深陷困扰的模型更新问题。
performanceinfrastructure
4月18日12 min
编排框架陷阱：LangChain 何时让你的上线速度反而变慢
LangChain 等 AI 编排框架能加速原型开发，但在规模化时会带来调试不透明、版本脆弱和抽象泄漏等问题。本文提供一套决策框架，帮你判断何时该用框架、何时该下沉一层直接调用。
ai-engineeringlangchain
4月18日9 min
工具过载问题：为什么工具越多，你的大模型越笨
当 LLM 面对大量工具集时，工具选择准确率会跌至 13%。本文解析工具过载如何拖垮你的 Agent，并介绍如何通过路由层、分层工具集和懒加载注册表来解决这一问题。
ai-engineeringagents
4月18日11 min
RAG 管道中的 PII 泄露：为什么你的聊天机器人知道它不该知道的事情
语义相似性并不遵循数据访问边界。本文将探讨 RAG 管道如何将敏感记录暴露给未经授权的用户，以及阻止这种行为的分层防御机制。
ragsecurity
4月18日12 min
Embedding的隐私架构：你的向量数据库对用户了解多少
对用户文档进行embedding会产生传统数据库没有的全新隐私攻击面。本文介绍重识别风险的工作原理、RAG管道中访问控制的失效点，以及真正能解决问题的架构模式。
insidersecurity
4月18日11 min
提示词考古：从无文档遗留提示词中还原设计意图
当你接手一个没有任何文档的生产提示词时，该如何弄清楚它的设计意图？本文提供了一套从无文档提示词中还原意图的系统方法，以及能帮助后续工程师避免同样困境的文档格式。
llmprompt-engineering
4月18日10 min
提示词债务螺旋：单行补丁如何摧毁生产环境的提示词
生产环境中的提示词通过增量补丁积累技术债务，这些补丁最终会演变成相互矛盾、臃肿的指令。本文将介绍如何识别这种螺旋式下降，并在提示词变得不可维护之前打破它。
insiderprompt-engineering
4月18日10 min
提示词治理问题：管理存在于代码库之外的业务逻辑
当你在产品、ML和基础设施团队中有50个以上活跃提示词时，你面对的是一个分布式系统问题，而不是写作问题。以下是防止其成为隐患的基础设施。
ai-engineeringllm
4月18日10 min
提示注入是供应链问题，而非输入验证问题
按请求净化给团队带来了虚假的安全感。随着RAG系统索引数百万文档、智能体消费第三方工具输出，真正的防御需要架构层面的控制：内容溯源、信任层级执行和沙箱隔离。
securityai-engineering
4月18日10 min

较新的博文

较旧的博文

Page 76

90% 可靠性之墙：为什么 AI 功能会陷入瓶颈以及该如何应对

随机系统的值班响应：为何你的 AI 运行手册需要重写

没人讨论的端侧 LLM 问题：模型更新传播

生产环境中的端侧 LLM 推理：何时选择边缘模型以及它们的实际成本

编排框架陷阱：LangChain 何时让你的上线速度反而变慢

工具过载问题：为什么工具越多，你的大模型越笨

RAG 管道中的 PII 泄露：为什么你的聊天机器人知道它不该知道的事情

Embedding的隐私架构：你的向量数据库对用户了解多少

提示词考古：从无文档遗留提示词中还原设计意图

提示词债务螺旋：单行补丁如何摧毁生产环境的提示词

提示词治理问题：管理存在于代码库之外的业务逻辑

提示注入是供应链问题，而非输入验证问题

关于 Tian Pan