今日头条推荐系统:P1 概述
· 阅读需 6 分钟
我们优化的目标是什么?用户满意度
我们正在寻找以下最佳 函数
以最大化 用户满意度
。
用户满意度 = 函数(内容, 用户画像, 上下文)
- 内容:文章、视频、用户生成内容短视频、问答等的特征。
- 用 户画像:兴趣、职业、年龄、性别和行为模式等。
- 上下文:工作空间、通勤、旅行等场景下的移动用户。
如何评估满意度?
-
可测量的目标,例如:
- 点击率
- 会话时长
- 点赞
- 评论
- 转发
-
难以测量的目标:
- 广告和特殊类型内容(问答)的频率控制
- 低俗内容的频率控制
- 减少点击诱饵、低质量、恶心内容
- 强制/固定/高度权重重要新闻
- 低权重来自低级账户的内容
如何优化这些目标?机器学习模型
寻找上述最佳 函数
是一个典型的监督机器学习问题。为了实现系统,我们有以下算法:
- 协同过滤
- 逻辑回归
- 深度神经网络
- 因子分解机
- GBDT
一个世界级的推荐系统应该具备 灵活性,能够进行 A/B 测试并结合上述多种算法。现在结合逻辑回归和深度神经网络的做法越来越流行。Facebook 多年前就同时使用了逻辑回归和 GBDT。