11.14字节秋招豆包大模型算法二面
二面
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder-only 成为大模型的主流架构,相比于 Encoder-Decoder的架构好在哪里
4.讲-下 ROPE ,目目前常用的位置编码还有哪些,ROPE 有什么优点
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么,DPO 相比 PPO的 RLHF 做了哪些改进,除此之外还知道哪些 RL算法
7. 代码:23.合并K个升序链表
1.自我介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder-only 成为大模型的主流架构,相比于 Encoder-Decoder的架构好在哪里
4.讲-下 ROPE ,目目前常用的位置编码还有哪些,ROPE 有什么优点
5.为什么有了 SFT 之后还需要 RLHF
6.PPO和 DPO 的主要思想是什么,DPO 相比 PPO的 RLHF 做了哪些改进,除此之外还知道哪些 RL算法
7. 代码:23.合并K个升序链表
全部评论
相关推荐
11-14 08:52
山东工商学院 C++
吴鹏阳:这个老师如果爱举报,你这门课确实可能挂科,这没办法。但是辅导员所谓的延毕,,怎么说呢,毕业生的就业率可是辅导员的一大考核,他咋可能为了一个逃课实习去损害自己的利益呢? 点赞 评论 收藏
分享


腾讯音乐娱乐集团成长空间 274人发布