跳到主要内容

开放权重模型许可是你的团队尚未规划的合规雷区

· 阅读需 11 分钟
Tian Pan
Software Engineer

在 “开放权重”(open-weight)这个词中,“开放” 二字承担了极大的重任。当一名工程师从模型中心下载 safetensors 文件时,他们往往倾向于将这种行为归类为与 npm install lodash 相同的心理范畴 —— 拉取依赖、上线功能、继续下一步。但伴随这些权重而来的许可证很少是 Apache 2.0 或 MIT。它通常是带有可接受使用例外项、署名要求、衍生品命名规则以及用户数量阈值的自定义社区许可证,一旦你的产品变得流行,这些阈值就会改变合同条款。而且,加载器几乎不会强制执行其中任何一项。无论你是否遵守,模型都会运行。

这就是合规债务如何悄无声息地累积的。如果团队将许可证审查视为一次性的下载检查,那么公司就在为一项审计结果埋单,而该结果将在点击 “我同意” 的开发者离职多年后才会显现。解决方法不是在入口处设置更严格的采购门槛,而是将模型权重视为供应链的一种严谨做法,具备来源追溯、定期重新审查以及一份能够将每条已部署的推理路径追溯回其上游许可证的清单。

“开放” 是一个光谱,而非 Apache 2.0 的同义词

当前的开放权重图景涵盖了至少四个截然不同的许可证系列,其实际差异比营销页面所暗示的更为重要。

真正的宽松型(Truly permissive)。 Apache 2.0 和 MIT 许可证 —— 被最近的 Qwen 文本模型、Mistral Small、OpenAI 的 gpt-oss 发布以及 DeepSeek V4 所采用 —— 是大多数开发者认为的 “开放权重” 的含义:免费商业使用、无 MAU 阈值、无衍生品命名规则、通过包含许可证文本即可满足署名要求。这些模型是最安全的基准线。

带阈值的自定义社区许可证。 Llama 系列是典型的例子。Llama 3 和 4 是可以商业使用的,但如果你的产品或母公司在发布时每月活跃用户超过 7 亿,许可证将自动失效。它还禁止使用 Llama 的输出来改进任何非 Llama 衍生的模型 —— 这一条款悄悄地使行业中最常见的成本降低模式失效,即使用强大的开放模型为来自不同系列的小型、更便宜的模型生成合成数据。

受使用限制的 “负责任 AI” 许可证。 越来越多的社区许可证增加了基于使用的限制,禁止特定应用:军事用途、监视、虚假信息的生成等。这些限制单独看起来是合理的,但它们创建了一个向下传播的合同表面。微调模型会继承这些限制,而一名为了邻近目的使用你的服务的客户,可能会让你的团队在技术上违反了一份你从未直接签署的上游协议。

仅限研究和非商业用途。 模型中心上惊人比例的社区微调是在 CC-BY-NC、“仅限研究” 或禁止产生收益使用的定制条款下发布的。它们在同一个仓库中与获得宽松授权的检查点并列,唯一的信号是模型卡片中一个小小的许可证标签。工程师们使用相同的 from_pretrained 调用来下载它们。

合规性问题并不在于任何单一许可证是否合理。问题在于工程师们敏锐地察觉到加载器并不在乎,因此选择发布哪个模型的决策是基于基准测试分数和部署易用性做出的 —— 而在你需要演示某些东西的周二下午,仅限研究的微调模型恰恰可能在这些维度上胜出。

任何加载器都无法察觉的谱系问题

微调是一种衍生作品。中心上的模型卡片通常会指明一个基础模型。而该基础模型又有自己的卡片指明其基础。一个现代的社区模型可能位于一个三到五层深的链条末端 —— 基础模型、持续预训练变体、指令微调后代、领域微调、量化,最后是某人正在笔记本电脑上加载到 Ollama 中的 GGUF 文件。

链条中的每个环节都有一个许可证。大多数工程团队只检查他们下载的最底层制品的许可证。但许可证条款会向上游传播,也会向下游延伸。如果曾祖级的基础模型具有禁止在金融咨询场景中使用的合规使用条款,而你的金融科技团队正在为智能投顾产品微调一个后代模型,那么这种违约是真实存在的,即使直接父级的卡片显示为 MIT 且推理输出没有任何提示。

加载中…
References:Let's stay in touch and Follow me for more thoughts and updates