博客

Page 108

12 articles

面向消费者的 LLM 功能红队测试：抢在用户之前发现注入攻击面
面向消费者的 LLM 功能面临着内部智能体从未遇到的攻击面。本指南提供关于注入向量、大规模越狱模式、模型反演风险以及生产级 AI 系统化加固方案的实用建议。
llmsecurity
4月18日12 min
检索单一化：为什么你的 RAG 系统存在系统性盲点
当所有查询都流经单一嵌入空间时，结构不同的查询类型会系统性地落入同样的盲区。本文介绍如何审计检索多样性并修复它，同时不牺牲延迟预算。
insiderrag
4月18日12 min
为具备代码编写能力的智能体构建沙箱：最小权限原则并非可选
仅靠 API 密钥范围限制是不够的。当你的 AI 智能体能够执行代码时，你需要容器隔离、文件系统命名空间、出站流量控制和权限审计流程——否则，只需一次提示词注入攻击，就可能引发横向移动安全事件。
insiderai-engineering
4月18日15 min
边缘AI推理：将推理从云端迁移的决策框架
面向工程师的实用决策框架：何时将LLM推理迁移到边缘端——延迟阈值、成本盈亏平衡分析、量化质量损耗，以及分割推理架构。
edge-aion-device-inference
4月18日11 min
AI 系统的影子流量：在上线前验证模型变更的最安全方式
如何使用生产流量回放在变更影响用户之前验证 LLM 模型和提示词变更——以 A/B 测试一小部分成本获得信心所需的基础设施、指标与采样策略。
insiderai-engineering
4月18日11 min
共享提示服务问题：多团队 LLM 平台与依赖噩梦
当五个团队共用一个 AI 服务时，一次系统提示变更会悄无声息地破坏四个团队的评估流程。这里是防止这一问题的依赖管理框架。
insiderllm
4月18日11 min
技能萎缩陷阱：AI 辅助如何悄无声息地侵蚀那些最依赖它的工程师
研究表明，AI 编程辅助会使理解能力得分降低 17%，并让有经验的开发者在自认快了 20% 的同时实际慢了 19%。以下是中级工程师最易陷入风险的原因，以及应对之策。
insiderai-engineering
4月18日12 min
非确定性 AI 功能的 SLO：当“错误”具有概率性时，如何设置错误预算
标准的可用性和错误率 SLO 无法捕捉 LLM 功能中的行为质量下降。本文将介绍如何定义行为质量 SLO，设置有意义的错误预算，并在正确性具有概率性时将其接入事件响应流程。
ai-engineeringsre
4月18日12 min
生产LLM系统中的规范博弈：当你的AI完全按照你说的去做
规范博弈不只是强化学习的理论问题——它出现在每一个存在激励梯度的生产LLM系统中。本文介绍如何发现它，以及如何构建更难被博弈的系统。
ai-engineeringllm
4月18日11 min
AI Agent 的 SRE：凌晨 3 点到底什么会出故障
传统的 SRE 运行手册无法涵盖 AI Agent 的失效模式。本文将探讨在生产环境中实际会发生的故障——死循环、上下文溢出、幻觉导致的 API 调用——以及如何通过监控、报警和成本控制来帮助值班工程师有效应对。
insiderai-engineering
4月18日12 min
LLM 应用中的 SSE vs WebSockets vs gRPC Streaming：那个稍后会让你头疼的协议抉择
探讨 SSE、WebSockets 和 gRPC streaming 在背压下的不同失效方式，分析哪些浏览器限制和边缘代理会在生产环境中引发故障，以及如何根据失效模式概览来选择你的传输协议。
llmstreaming
4月18日13 min
有状态多轮对话基础设施：超越传递完整历史记录
为什么「传递完整对话历史」在 p99 规模下会失效，以及真正能在生产环境中撑得住的会话存储设计、压缩策略和运维模式。
insiderai-engineering
4月18日12 min

较新的博文

较旧的博文

Page 108

面向消费者的 LLM 功能红队测试：抢在用户之前发现注入攻击面

检索单一化：为什么你的 RAG 系统存在系统性盲点

为具备代码编写能力的智能体构建沙箱：最小权限原则并非可选

边缘AI推理：将推理从云端迁移的决策框架

AI 系统的影子流量：在上线前验证模型变更的最安全方式

共享提示服务问题：多团队 LLM 平台与依赖噩梦

技能萎缩陷阱：AI 辅助如何悄无声息地侵蚀那些最依赖它的工程师

非确定性 AI 功能的 SLO：当“错误”具有概率性时，如何设置错误预算

生产LLM系统中的规范博弈：当你的AI完全按照你说的去做

AI Agent 的 SRE：凌晨 3 点到底什么会出故障

LLM 应用中的 SSE vs WebSockets vs gRPC Streaming：那个稍后会让你头疼的协议抉择

有状态多轮对话基础设施：超越传递完整历史记录

关于 Tian Pan