博客

Page 52

12 articles

Token 预算是新一代的内部 IAM
当你的 AI 账单跨过七位数时，Token 配额就不再只是一个财务数字，而是开始演变为一种授权边界。为什么配额分配需要 IAM 级别的纪律，而不是简单的仪表板滑块。
llmopsfinops
4月26日12 min
Tokenizer Churn：你的“兼容”模型升级中隐藏的破坏性变更
供应商的模型升级可能会在保持 API 字节级稳定的同时，悄悄更换底层的 tokenizer —— 从而在无形中破坏上下文预算、停止序列和 few-shot prompt。本文将介绍如何审计、固定以及在 tokenizer churn 中生存。
insiderllm
4月26日13 min
难撤销操作的工具分类学：每个风险类别设置一个审批关卡
二元化的工具审批在负载下会失效：如果一个简单的确认对话框既用于保存草稿又用于对外支付，必然会诱导用户养成不假思索点击确认的习惯。一套六级风险分类法可以解决这种混淆问题。
ai-agentssecurity
4月26日10 min
你的工具目录遵循幂律分布，而你却在针对长尾进行优化
生产环境中的工具使用遵循幂律分布，但大多数 Agent 框架都将工具目录视为扁平结构，并为此付出了代价：Token 膨胀、工具数量超过 100 个时的准确度崩塌，以及隐性的长尾回归。这是一份关于热/冷分区的实战指南。
insiderai-agents
4月26日13 min
工具组合提权：你的安全审查清理了节点，而非边缘
针对单个工具的安全审查清理了节点，但智能体运行的是轨迹。智能体工具目录的组合图是一个安全团队从未枚举过的权限集，而混淆代理攻击就存在于这些边缘之中。
insiderai-agents
4月26日12 min
信任天花板：产品团队忽视的自主性变量
AI Agent 的发展受限于信任天花板 —— 即用户开始核查、干预或放弃该功能的临界点。应将其视为可衡量的产品变量，而非单纯的模型问题。
agentic-aiproduct-design
4月26日12 min
拒绝还是上报：置信度门控 AI 中的双阈值问题
单个置信度阈值将“拒绝”和“上报”这两个截然不同的决策强行合并为一个数字，而这种妥协正是导致你的信任度指标持续下滑的原因，即便在准确率看起来还不错的情况下也是如此。
insiderllm
4月26日14 min
第三份副本：向量存储、删除完整性以及 RAG 团队一直忽视的 GDPR 缺口
当用户行使被遗忘权时，删除源文本并不代表删除了嵌入向量。大多数团队从未将向量存储建模为用户数据的“第三份副本” —— 而关于逆向攻击的相关文献表明，他们理应这样做。
securityprivacy
4月26日12 min
供应商可迁移性税：为什么“我们可以更换模型”是每季度的成本项，而非一个勾选项
跨 LLM 供应商的行为可迁移性在你停止投入的那一刻就开始衰减。本文分析了每季度的资金消耗——评估订阅费、基于模型的提示词路由、合约议价权——这些因素让“我们可以更换模型”从 PPT 上的愿景变成了现实中的可选项。
llmvendor-strategy
4月26日12 min
供应商 99.9% 的 SLA 对你的 Agent 来说衡量边界错了
供应商 99.9% 的可用性是按单次调用衡量的；而你的 Agent 每个任务需要进行 12 次调用。本文将探讨其中的算术逻辑、缺失的合同条款，以及如何在用户察觉之前捕获故障的发散告警。
insidersla
4月26日14 min
为什么你的语音智能体显得很没礼貌：话轮转换是你从未记录过的延迟预算
为什么语音智能体显得很没礼貌：解析四阶段延迟预算、混合话轮检测、全双工音频以及保护状态的抢占协议。
ai-engineeringvoice-ai
4月26日12 min
你的智能体发件箱将是你的下一个送达率事故
一个智能体在早餐前发出了 80,000 封邮件，导致重置密码域名的声誉在六周内荡然无存。在第一次发送之前，你需要建立子域名、DKIM 和速率限制的纪律。
insideragents
4月25日13 min

较新的博文

较旧的博文

Page 52

Token 预算是新一代的内部 IAM

Tokenizer Churn：你的“兼容”模型升级中隐藏的破坏性变更

难撤销操作的工具分类学：每个风险类别设置一个审批关卡

你的工具目录遵循幂律分布，而你却在针对长尾进行优化

工具组合提权：你的安全审查清理了节点，而非边缘

信任天花板：产品团队忽视的自主性变量

拒绝还是上报：置信度门控 AI 中的双阈值问题

第三份副本：向量存储、删除完整性以及 RAG 团队一直忽视的 GDPR 缺口

供应商可迁移性税：为什么“我们可以更换模型”是每季度的成本项，而非一个勾选项

供应商 99.9% 的 SLA 对你的 Agent 来说衡量边界错了

为什么你的语音智能体显得很没礼貌：话轮转换是你从未记录过的延迟预算

你的智能体发件箱将是你的下一个送达率事故

关于 Tian Pan