快手推荐算法 27暑期一面分享
有面试过同岗的朋友欢迎评论区交流
‘1.项目拷打
2.为什么主模型不能加入相关特征
3.业务视频的后验的均值label有特殊的嘛
4.样本如何构造的
5.模型是冷启动还是热启动,为什么要这样;冷启动多久能收敛
6.介绍MMCN
7.模型上线有多少资源消耗
8.Ihuc具体是放在哪一层的
9.tokenmixer和mmcn的区别是什么,为什么没有推tokenmixer
10.MMCN的scaling效果怎么样;
11.相同的参数量,mmcn和tokenmixer的训练速度有区别嘛,样本数量,资源数量
12.缓解负迁移是怎么做的
13.从这个项目实习中有什么收获嘛
14.样本的存储格式是怎么样的
15.还了解业界的其他精排模型
代码
二维dp:最短路径
‘1.项目拷打
2.为什么主模型不能加入相关特征
3.业务视频的后验的均值label有特殊的嘛
4.样本如何构造的
5.模型是冷启动还是热启动,为什么要这样;冷启动多久能收敛
6.介绍MMCN
7.模型上线有多少资源消耗
8.Ihuc具体是放在哪一层的
9.tokenmixer和mmcn的区别是什么,为什么没有推tokenmixer
10.MMCN的scaling效果怎么样;
11.相同的参数量,mmcn和tokenmixer的训练速度有区别嘛,样本数量,资源数量
12.缓解负迁移是怎么做的
13.从这个项目实习中有什么收获嘛
14.样本的存储格式是怎么样的
15.还了解业界的其他精排模型
代码
二维dp:最短路径
全部评论
相关推荐
