被你的采购团队当成数据表的模型卡片
· 阅读需 12 分钟
模型卡(model card)是一件研究产物。而数据表(datasheet)是一份合同。采购团队通常会像阅读后者一样阅读前者,而交付它的 AI 厂商现在正受限于其工程团队原以为只是叙述性的声明。
这是丢掉续约最干脆利落的方式:你转发了发布在模型索引页上的同一个 PDF,客户的法务团队将其中四句话摘录到了附件 B(Schedule B)中,十二个月后你发现“预期用途:通用问答”已变成关于服务范围的合同陈述。你的团队用 BLEU 分值来衡量这些句子,而他们的团队现在正用违约代价来衡量。
错误不在于模型卡写错了。在编写的那一刻,它几乎肯定是准确的。错误在于两种不同的专业文化在阅读同一份文档时,对“一个句子是什么”有着两种截然不同的看法。研究人员编写模型卡是为了告知下游关于行为的决策。采购评审人员则将任何厂商提供的文档视为承诺界面——在未经协商修改之前,每一项声明都是一个条款。双方都没有注意到体裁上的错配,因为在页面上,这份产物看起来确实像文档。
