博客

Page 107

12 articles

随机系统的值班响应：为何你的 AI 运行手册需要重写
传统故障响应假设故障是可复现的，但 LLM 驱动的系统并非如此。以下是如何针对非确定性 AI 重写告警方案、分类决策树和事后分析模板。
insiderai-engineering
4月18日12 min
没人讨论的端侧 LLM 问题：模型更新传播
将 LLM 部署到边缘设备会创建一个没有中央回滚机制的分布式系统——版本碎片化、无声的能力漂移，以及在基准测试中根本不会暴露的制品集合不匹配问题。
insideredge-ai
4月18日13 min
生产环境中的端侧 LLM 推理：何时选择边缘模型以及它们的实际成本
在 iOS、Android 和浏览器上运行 LLM 推理的隐私、延迟和离线优势——以及质量与体积的权衡、成本计算，以及在上线六个月后让团队深陷困扰的模型更新问题。
performanceinfrastructure
4月18日12 min
编排框架陷阱：LangChain 何时让你的上线速度反而变慢
LangChain 等 AI 编排框架能加速原型开发，但在规模化时会带来调试不透明、版本脆弱和抽象泄漏等问题。本文提供一套决策框架，帮你判断何时该用框架、何时该下沉一层直接调用。
ai-engineeringlangchain
4月18日9 min
工具过载问题：为什么工具越多，你的大模型越笨
当 LLM 面对大量工具集时，工具选择准确率会跌至 13%。本文解析工具过载如何拖垮你的 Agent，并介绍如何通过路由层、分层工具集和懒加载注册表来解决这一问题。
ai-engineeringagents
4月18日11 min
RAG 管道中的 PII 泄露：为什么你的聊天机器人知道它不该知道的事情
语义相似性并不遵循数据访问边界。本文将探讨 RAG 管道如何将敏感记录暴露给未经授权的用户，以及阻止这种行为的分层防御机制。
ragsecurity
4月18日12 min
Embedding的隐私架构：你的向量数据库对用户了解多少
对用户文档进行embedding会产生传统数据库没有的全新隐私攻击面。本文介绍重识别风险的工作原理、RAG管道中访问控制的失效点，以及真正能解决问题的架构模式。
insidersecurity
4月18日11 min
提示词考古：从无文档遗留提示词中还原设计意图
当你接手一个没有任何文档的生产提示词时，该如何弄清楚它的设计意图？本文提供了一套从无文档提示词中还原意图的系统方法，以及能帮助后续工程师避免同样困境的文档格式。
llmprompt-engineering
4月18日10 min
提示词债务螺旋：单行补丁如何摧毁生产环境的提示词
生产环境中的提示词通过增量补丁积累技术债务，这些补丁最终会演变成相互矛盾、臃肿的指令。本文将介绍如何识别这种螺旋式下降，并在提示词变得不可维护之前打破它。
insiderprompt-engineering
4月18日10 min
提示词治理问题：管理存在于代码库之外的业务逻辑
当你在产品、ML和基础设施团队中有50个以上活跃提示词时，你面对的是一个分布式系统问题，而不是写作问题。以下是防止其成为隐患的基础设施。
ai-engineeringllm
4月18日10 min
提示注入是供应链问题，而非输入验证问题
按请求净化给团队带来了虚假的安全感。随着RAG系统索引数百万文档、智能体消费第三方工具输出，真正的防御需要架构层面的控制：内容溯源、信任层级执行和沙箱隔离。
securityai-engineering
4月18日10 min
提示词本地化技术债：隐藏在多语言 AI 产品中的无声质量梯度
为什么在英语中表现为 91% 的提示词，在日语或阿拉伯语中会悄然下降到 72% —— 以及如何构建评估基础设施，在这些回归影响到非英语用户之前捕获它们。
insiderai-engineering
4月18日11 min

较新的博文

较旧的博文

Page 107

随机系统的值班响应：为何你的 AI 运行手册需要重写

没人讨论的端侧 LLM 问题：模型更新传播

生产环境中的端侧 LLM 推理：何时选择边缘模型以及它们的实际成本

编排框架陷阱：LangChain 何时让你的上线速度反而变慢

工具过载问题：为什么工具越多，你的大模型越笨

RAG 管道中的 PII 泄露：为什么你的聊天机器人知道它不该知道的事情

Embedding的隐私架构：你的向量数据库对用户了解多少

提示词考古：从无文档遗留提示词中还原设计意图

提示词债务螺旋：单行补丁如何摧毁生产环境的提示词

提示词治理问题：管理存在于代码库之外的业务逻辑

提示注入是供应链问题，而非输入验证问题

提示词本地化技术债：隐藏在多语言 AI 产品中的无声质量梯度

关于 Tian Pan