小红书推荐算法校招二面

1.Reward Function的设计
2. PPO Advantage Function
3.PPO/GRPO
4.全参微调 /LORA
5.DeepSeek V3训练流程
6.CVR样本稀疏解决方法
7.偏置特征处理方法
8.生成式推荐和常规推荐的区别 以及核心收益点
9.RQ-KMeans/RQ VAE 区别
全部评论

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务