博客

Page 88

12 articles

区分优秀AI工程师与普通工程师的思维模型转变
从确定性系统到随机系统的过渡会让优秀的工程师陷入困境。以下是真正区分有经验的AI工程师与其他人的思维模型、调试直觉和实践方法。
ai-engineeringengineering-leadership
4月18日11 min
模型弃用是一场等待发生的生产事故
LLM提供商会在6-12个月的窗口期内弃用模型，但大多数团队将迁移视为积压工作——直到它变成凌晨3点的故障。以下是使模型升级变得平常无奇的运营手册。
llmopsai-engineering
4月18日10 min
多租户 AI 系统：大规模场景下的隔离、定制与成本归因
如何在共享的 AI 基础设施中为多个客户提供服务，同时避免数据泄露、消除喧闹邻居效应，并精准追踪每个租户的成本支出。
ai-engineeringarchitecture
4月18日12 min
生产环境中的多模态智能体：纯文本评估从未发现的问题
在智能体管道中加入视觉和文档输入会引入纯文本评估从未发现的故障模式。本文介绍实践者遇到的问题以及如何构建能够捕获这些问题的评估体系。
ai-engineeringagents
4月18日11 min
多模态AI在生产环境中的落地：基准测试与现实之间的鸿沟
视觉和音频模型在演示中令人印象深刻。但在生产环境中，它们面临延迟惩罚、空间定位失败和提取不一致等问题，而大多数基准测试分数完全掩盖了这些问题。
ai-engineeringmultimodal
4月18日12 min
90% 可靠性之墙：为什么 AI 功能会陷入瓶颈以及该如何应对
为什么 AI 功能在可靠性达到 90% 左右时会停滞不前，如何诊断可减少误差与不可减少误差，以及能让你交付真实价值的产品架构决策。
ai-engineeringreliability
4月18日11 min
随机系统的值班响应：为何你的 AI 运行手册需要重写
传统故障响应假设故障是可复现的，但 LLM 驱动的系统并非如此。以下是如何针对非确定性 AI 重写告警方案、分类决策树和事后分析模板。
insiderai-engineering
4月18日12 min
没人讨论的端侧 LLM 问题：模型更新传播
将 LLM 部署到边缘设备会创建一个没有中央回滚机制的分布式系统——版本碎片化、无声的能力漂移，以及在基准测试中根本不会暴露的制品集合不匹配问题。
insideredge-ai
4月18日13 min
生产环境中的端侧 LLM 推理：何时选择边缘模型以及它们的实际成本
在 iOS、Android 和浏览器上运行 LLM 推理的隐私、延迟和离线优势——以及质量与体积的权衡、成本计算，以及在上线六个月后让团队深陷困扰的模型更新问题。
performanceinfrastructure
4月18日12 min
编排框架陷阱：LangChain 何时让你的上线速度反而变慢
LangChain 等 AI 编排框架能加速原型开发，但在规模化时会带来调试不透明、版本脆弱和抽象泄漏等问题。本文提供一套决策框架，帮你判断何时该用框架、何时该下沉一层直接调用。
ai-engineeringlangchain
4月18日9 min
工具过载问题：为什么工具越多，你的大模型越笨
当 LLM 面对大量工具集时，工具选择准确率会跌至 13%。本文解析工具过载如何拖垮你的 Agent，并介绍如何通过路由层、分层工具集和懒加载注册表来解决这一问题。
ai-engineeringagents
4月18日11 min
RAG 管道中的 PII 泄露：为什么你的聊天机器人知道它不该知道的事情
语义相似性并不遵循数据访问边界。本文将探讨 RAG 管道如何将敏感记录暴露给未经授权的用户，以及阻止这种行为的分层防御机制。
ragsecurity
4月18日12 min

较新的博文

较旧的博文

Page 88

区分优秀AI工程师与普通工程师的思维模型转变

模型弃用是一场等待发生的生产事故

多租户 AI 系统：大规模场景下的隔离、定制与成本归因

生产环境中的多模态智能体：纯文本评估从未发现的问题

多模态AI在生产环境中的落地：基准测试与现实之间的鸿沟

90% 可靠性之墙：为什么 AI 功能会陷入瓶颈以及该如何应对

随机系统的值班响应：为何你的 AI 运行手册需要重写

没人讨论的端侧 LLM 问题：模型更新传播

生产环境中的端侧 LLM 推理：何时选择边缘模型以及它们的实际成本

编排框架陷阱：LangChain 何时让你的上线速度反而变慢

工具过载问题：为什么工具越多，你的大模型越笨

RAG 管道中的 PII 泄露：为什么你的聊天机器人知道它不该知道的事情

关于 Tian Pan