博客

Page 83

12 articles

生产环境中的 AI 内容溯源：C2PA、审计轨迹与工程师正在忽视的合规截止日期
C2PA 提供加密证明，记录谁在何时签署了 AI 生成内容。但它无法在你的 CDN 中存活，无法单独满足欧盟 AI 法案要求，也无法告诉你内容是否真实。以下是生产级内容溯源的真实面貌。
aiproduction
4月18日14 min
为什么用户会忽略你花了三个月构建的 AI 功能
AI 功能之所以失败，不是因为模型不好，而是因为用户从未发现它们、不信任它们，或者没有养成使用它们的习惯。以下是解决方法。
insiderai engineering
4月18日12 min
当你的 AI 功能过时：生产环境中的知识切断与时间溯源
基于具有固定训练切断点模型构建的产品，会随着世界与训练数据的偏离而失效。本文将介绍如何检测由知识切断引起的故障、管理 RAG 的新鲜度，并在时间漂移演变为隐蔽的生产回归之前进行针对性设计。
insiderai-engineering
4月18日12 min
AI功能维护悬崖：为何你的AI功能老化速度超乎想象
AI功能不只是退化——它们是无声地退化。提示词漂移、模型更新和分布偏移共同侵蚀生产环境中的AI质量，而监控面板全程保持绿色。
llmproduction
4月18日10 min
AI 功能下线指南：如何停用那些用户几乎不用的功能
大多数工程团队都知道如何发布 AI 功能，但几乎没有人有下线它们的计划。本文将为你提供一份指南，告诉你何时该放弃，以及如何在不伤害用户或积累合规债务的情况下完成下线。
aiproduct
4月18日13 min
AI 事件响应手册：诊断生产环境中的 LLM 性能退化
当你的 LLM 功能在生产环境中出现退化时，标准的 SRE 运行手册会让你无从下手。这里有一份专门为 AI 系统构建的诊断树、提示词回滚策略和事后分析模板。
ai engineeringreliability
4月18日16 min
AI 事故应对指南：当你的智能体造成现实世界损害时
当 AI 智能体造成现实世界的损害时，你现有的停服应对指南会误导你。这是一份专为随机系统构建的策略：如何在没有堆栈跟踪的情况下界定爆炸半径、在证据消失前进行保全，以及如何在“模型幻觉”之外进行深入调查。
insiderai-engineering
4月18日12 min
AI 输出的版权陷阱：工程师在演变成法律问题前需要了解的知识
训练数据记忆、演绎作品原则以及输出所有权是当前存在直接工程影响的法律争议。本文将介绍风险面以及能够切实降低法律责任的管控措施。
ai-engineeringlegal
4月18日12 min
AI 审美难题：在没有标准答案时如何衡量质量
当准确性指标失去意义时，如何评估 AI 的输出——文案创作、创意内容和设计背后的两两比较研究、评分者间信度和 LLM 评审员的工程学科。
aievaluation
4月18日13 min
AI 技术债的三座无声时钟
与代码债务不同，AI 特有的技术债——提示词漂移、评估侵蚀和嵌入陈旧——会以隐蔽的方式累积。本文将介绍如何在这些时钟耗尽之前检测它们。
ai-engineeringllmops
4月18日11 min
标注经济学：每种标签来源背后隐藏的代价
在评测标签来源的选择上——人类领域专家、众包工人、LLM 合成生成和行为推断——的决策框架，以及何时「无标注」才是正确答案。
insiderevaluation
4月18日9 min
无需标注的评估：在拥有标准答案前衡量 LLM 质量
一份在第一周 —— 即在你拥有标注数据之前 —— 衡量 LLM 输出质量的实用指南。涵盖了自我一致性、约束满足、行为不变性以及 LLM 作为裁判（LLM-as-judge），并探讨了每种方法的失效模式。
llm-evaluationai-engineering
4月18日13 min

较新的博文

较旧的博文

Page 83

生产环境中的 AI 内容溯源：C2PA、审计轨迹与工程师正在忽视的合规截止日期

为什么用户会忽略你花了三个月构建的 AI 功能

当你的 AI 功能过时：生产环境中的知识切断与时间溯源

AI功能维护悬崖：为何你的AI功能老化速度超乎想象

AI 功能下线指南：如何停用那些用户几乎不用的功能

AI 事件响应手册：诊断生产环境中的 LLM 性能退化

AI 事故应对指南：当你的智能体造成现实世界损害时

AI 输出的版权陷阱：工程师在演变成法律问题前需要了解的知识

AI 审美难题：在没有标准答案时如何衡量质量

AI 技术债的三座无声时钟

标注经济学：每种标签来源背后隐藏的代价

无需标注的评估：在拥有标准答案前衡量 LLM 质量

关于 Tian Pan