小红书NLP大模型算法秋招二面

1.展开讲一下在百度实习的工作,想法是如何逐步优化的?
2.介绍一下了解的其他基于 MoE 的模型架构
3.如果基于 MoE 的模型在训练时负载均衡不好怎么办?
4.讲一下负载均衡的概念,如何解决负载均衡问题?
5.讲一下DPO、PPO、GRPO的区别
6.Deepseek r1中的训练方式有什么特别之处?怎么做的think?RLHF的流程是什么?
7.如果在训练 DPO 的过程中,正例和负例的 loss 都在下降,该如何解决?
8.讲一下 RAG 项目的亮点
9.如果召回的答案不是想要的,该怎么处理?
10.量化加速方面有了解吗?解释一下vllm
11.代码题:lc129 求根节点到叶节点数字之和
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务