11.14字节秋招豆包大模型算法二面

二面
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder-only 成为大模型的主流架构,相比于 Encoder-Decoder的架构好在哪里
4.讲-下 ROPE ,目目前常用的位置编码还有哪些,ROPE 有什么优点
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么,DPO 相比 PPO的 RLHF 做了哪些改进,除此之外还知道哪些 RL算法
7. 代码:23.合并K个升序链表
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务