小红书推荐算法校招二面
1.Reward Function的设计
2. PPO Advantage Function
3.PPO/GRPO
4.全参微调 /LORA
5.DeepSeek V3训练流程
6.CVR样本稀疏解决方法
7.偏置特征处理方法
8.生成式推荐和常规推荐的区别 以及核心收益点
9.RQ-KMeans/RQ VAE 区别
2. PPO Advantage Function
3.PPO/GRPO
4.全参微调 /LORA
5.DeepSeek V3训练流程
6.CVR样本稀疏解决方法
7.偏置特征处理方法
8.生成式推荐和常规推荐的区别 以及核心收益点
9.RQ-KMeans/RQ VAE 区别
全部评论
相关推荐
查看1道真题和解析