博客

Page 62

12 articles

无法合并的智能体重构：为什么多文件差异会在衔接处崩溃
智能体编写的重构在单个文件内看起来很整洁，但在衔接处往往会失效。本文探讨了为什么代码块级别的审查会遗漏跨文件漏洞，以及如何通过“编译优先”和程序分析准则来解决这一问题。
insidercoding-agents
4月22日10 min
验证器陷阱：事后防御如何从内部腐蚀你的提示词
你给 LLM 增加的每一个输出验证器听起来都像是一个修复方案。随着时间的推移，这些修复会将你的提示词重写为一份防御性合同，从而剥夺模型的推理能力。本文将介绍如何审计并修复这种损害。
insiderllm
4月22日10 min
语音智能体并非带麦克风的聊天机器人：半双工税
语音智能体继承了人类的半双工协议，而非聊天的舒适感。轮换协商、插话处理以及真实的 200 ms 预算，决定了你的智能体听起来是专注还是诡异。
voice-ailatency
4月22日12 min
智能体集群并发：在没有死锁或惊群效应的情况下协调数十个智能体
LLM 智能体集群是一个小型分布式系统，而不是单个智能体的三十个副本。准入控制、AIMD 背压、熔断器和外部状态协调是防止并发集群自我崩溃的关键。
insiderai-agents
4月21日13 min
AI 更新日志问题：为什么你的提示词更新正在破坏其他团队的工作
提示词编辑、模型升级和工具架构调整会在不改变代码的情况下改变行为。这里有能让消费团队保持畅通的更新日志格式和版本控制契约。
insiderai-engineering
4月20日13 min
在写第一个 Prompt 之前，先设计好你的 Agent 状态机
先写 Prompt 再拼接逻辑的直觉，会导致 agent 在简单测试中正常运行，却在生产环境中神秘失败。先设计状态机，会改变一切。
insiderai-engineering
4月19日11 min
数据回滚难题：如何撤销AI智能体写入生产环境的数据
当AI智能体以机器速度在分布式系统中写入生产数据时，传统数据库回滚机制就会失效。本文介绍使智能体写入状态可恢复所需的架构转变。
ai-agentsdistributed-systems
4月19日11 min
归因鸿沟：如何将用户投诉追溯到具体的模型决策
当用户反馈AI给出错误建议时，大多数团队无法重建是哪个模型版本、哪个提示词或哪段检索上下文产生了该输出。本文介绍让AI投诉可追查的日志方案、追踪传播和采样策略。
llm-observabilityai-engineering
4月19日13 min
AI 审计追踪是产品功能，而非合规勾选项
向用户展示你的 AI 智能体实际做了什么——调用了哪些工具、检索了哪些数据、在何处产生了分支——比任何功能开关实验都能更可靠地提高采用率。以下是构建方法。
insiderai-agents
4月19日10 min
AI 代码审查实践：自动化 PR 分析真正能发现什么，又持续遗漏什么
AI代码审查工具在拼写错误和空指针检查方面的准确率为70-85%，但遗漏语义错误的概率高达85-90%。本文提供实证数据分析，并介绍避免自动审批沦为橡皮图章的工作流设计。
insidercode-review
4月19日10 min
受监管行业的 AI 合规基础设施：大语言模型框架没能提供给你的东西
金融、医疗和法律领域的部署需要不可变的审计日志、输出血缘、拒绝跟踪和可解释性钩子，而大多数大语言模型框架并不能开箱即用地提供这些功能。本文介绍了填补这一空白的架构。
insidercompliance
4月19日12 min
没人用的 AI 功能：团队为何交付了无人采用的能力
大多数 AI 功能的采用率只有 2-6%。差距不在模型，而在用户根本找不到这个功能。本文解释为什么传统发现模式对 AI 无效，以及真正有效的方法。
insiderai
4月19日10 min

较新的博文

较旧的博文

Page 62

无法合并的智能体重构：为什么多文件差异会在衔接处崩溃

验证器陷阱：事后防御如何从内部腐蚀你的提示词

语音智能体并非带麦克风的聊天机器人：半双工税

智能体集群并发：在没有死锁或惊群效应的情况下协调数十个智能体

AI 更新日志问题：为什么你的提示词更新正在破坏其他团队的工作

在写第一个 Prompt 之前，先设计好你的 Agent 状态机

数据回滚难题：如何撤销AI智能体写入生产环境的数据

归因鸿沟：如何将用户投诉追溯到具体的模型决策

AI 审计追踪是产品功能，而非合规勾选项

AI 代码审查实践：自动化 PR 分析真正能发现什么，又持续遗漏什么

受监管行业的 AI 合规基础设施：大语言模型框架没能提供给你的东西

没人用的 AI 功能：团队为何交付了无人采用的能力

关于 Tian Pan