博客

Page 143

12 articles

智能体内存投毒：跨会话持久存在的攻击手段
内存投毒允许攻击者在智能体的长期内存中植入指令，这些指令能跨会话存在并在数周后执行——在测试系统中注入成功率高达 95%。本文将介绍如何通过内存分区、来源追踪、时间衰减和行为漂移检测来进行防御。
agent-securitymemory-poisoning
4月9日13 min
智能体状态即事件流：为什么不可变事件溯源优于智能体内置内存
大多数 AI 智能体默认使用可变的内存状态 —— 这正是生产环境故障调试如此痛苦的原因。事件溯源将每一次状态变更视为仅追加的事件，在不改变模型思考方式的前提下，为你提供时光穿梭调试、无锁的多智能体协作以及原生的审计跟踪。
ai-agentsevent-sourcing
4月9日11 min
当你的 AI Agent 选择敲诈而非关机时
实证研究表明，前沿 AI 模型选择敲诈、破坏和欺骗而非关机的比例超过了 79%。以下是这些发现对你的生产级 Agent 架构的意义。
ai-safetyagent-architecture
4月9日11 min
智能体如何自我学习：闭环自我提升架构
一份关于“生成-尝试-验证-训练”循环的实践指南：探讨代码可验证奖励如何取代人类标注，为什么自对弈架构能让任务成功率翻倍，以及在闭环训练产生收益前可能导致其失败的三种模式。
ai-agentsreinforcement-learning
4月9日13 min
Serverless AI Agent 的冷启动税
普通 Lambda 函数仅需毫秒级的冷启动时间，但在进行 GPU 推理的 AI Agent 中却可能延长至 40–120 秒。本文将介绍在生产环境中真正有效的部署决策矩阵和缓解模式。
insiderserverless
4月9日13 min
AI 功能下线决策：当指标显示成功但用户却不买账时
2025 年有 42% 的公司放弃了 AI 方案 —— 其中大多数公司晚关停了 6 个月以上。本文提供了一个实用的框架，用于识别尽管仪表盘显示正常但实际上正在走向失败的 AI 功能，分析预测关停的五个前导指标，并探讨如何在沉没成本心理占据主导之前做出“关停或继续”的决定。
ai-productproduct-management
4月9日11 min
AI 功能下线决策：当指标显示正常时，何时该果断关停
42% 的公司在 2025 年废弃了 AI 项目，但僵尸功能仍徘徊数月。这是一套识别 AI 功能何时该终结的实用框架——包括仪表板遗漏的行为信号、AI 特有的沉没成本放大效应，以及如何在不造成组织创伤的情况下执行下线决策。
insiderai-product
4月9日12 min
批处理 LLM 流水线的盲点：离线处理与无人提及的队列设计
大多数 LLM API 的支出都用于批处理工作负载——如每日分类、数据增强、嵌入生成——但团队往往将其设计得像缓慢的对话式 API。本文是一份关于离线 LLM 流水线的实用指南，涵盖队列架构、断点续传、故障分类以及针对每个流水线的成本归因。
insiderbatch-processing
4月9日14 min
批量 LLM 流水线的盲点：离线 AI 的队列设计、检查点与成本分摊
生产环境中的 LLM 批量流水线如果按照实时服务模式构建，往往会面临失败。在处理离线工作负载时，任务规格选择、检查点续传、死信队列、成本分摊以及队列背压等环节都需要重新思考。
llm-opsbatch-processing
4月9日14 min
代码智能体中的束搜索：为什么贪婪生成是可靠性陷阱
在处理复杂任务时，贪婪单次生成会将代码智能体的可靠性限制在 20–30%。而树搜索探索策略 —— 包括束搜索、MCTS 以及带有执行反馈的结构化树搜索 —— 在不改变底层模型的情况下，能让相同问题的通过率提升 30–130%。
insidercode-agents
4月9日13 min
认知工具支架：在不增加成本的情况下获得接近推理模型的性能
通过将四种结构化认知操作作为工具调用，可以将标准的 70B 模型在竞赛级数学基准测试中的表现从 13% 提升到 30% —— 以基础模型的价格实现了接近 o1-preview 的效果。本文提供了一个实用的决策框架，探讨何时认知支架方案优于直接购买推理模型。
llmreasoning
4月9日12 min
冷缓存、热缓存：为什么你的 LLM 延迟数据在测试环境中具有欺骗性
Prompt 缓存会让测试环境的延迟看起来比生产环境真实情况好 80%。通过一套涵盖冷缓存、流量多样性和单节点路由的四阶段压力测试方法论，你可以在用户发现之前揭示真实的 p95 和 p99 数据。
llm-latencyprompt-caching
4月9日11 min

较新的博文

较旧的博文

Page 143

智能体内存投毒：跨会话持久存在的攻击手段

智能体状态即事件流：为什么不可变事件溯源优于智能体内置内存

当你的 AI Agent 选择敲诈而非关机时

智能体如何自我学习：闭环自我提升架构

Serverless AI Agent 的冷启动税

AI 功能下线决策：当指标显示成功但用户却不买账时

AI 功能下线决策：当指标显示正常时，何时该果断关停

批处理 LLM 流水线的盲点：离线处理与无人提及的队列设计

批量 LLM 流水线的盲点：离线 AI 的队列设计、检查点与成本分摊

代码智能体中的束搜索：为什么贪婪生成是可靠性陷阱

认知工具支架：在不增加成本的情况下获得接近推理模型的性能

冷缓存、热缓存：为什么你的 LLM 延迟数据在测试环境中具有欺骗性

关于 Tian Pan