首页 > 试题广场 > 主观题目:《猜你喜欢的音乐》请为网易云音乐的“每
[问答题]
主观题目:《猜你喜欢的音乐》请为网易云音乐的“每日推荐”模块设计一个算法方案,可以从召回模型、排序模型、数据和特征、离线在线等方面描述。
将整个推荐系统的架构分为三个部分,在线部分,近线部分和离线部分。
对于在线部分,首先通过多路召回(基于少量特征以达到较高处理速度)将歌曲数量过滤到千量级以下,如果歌曲数量还是太多,可以加入粗排序进一步降低歌曲数量。接着进入精排序阶段,可以采用具有特征组合的模型(比如FM或DGBT+LR)进行个性化的排序。最后进入重排序阶段,这个阶段将融入业务策略(比如去已读,广告等等),然后将歌曲推荐给用户。
对于近线部分,需要实时收集用户数据,并将它们整理成可训练的数据,一方面喂给实时模型进行在线训练,一部分存储为历史数据为离线模型的训练做准备。
对于离线部分,主要是利用收集的历史数据周期性更新离线模型,由于数据规模通常非常大(几百GB甚至几TB),所以这个部分需要利用高效的分布式机器学习平台。
发表于 2021-04-28 16:30:10 回复(0)