字节豆包大模型二面-日常实习
1.项目介绍,问实习和论文
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
2.实习微调过Qwen2,你说说Qwen2的模型结构吧,Qwen2相比Qwen1做了哪些改进
3.为什么现在 Decoder - only 成为大模型的主流架构
4.了解过哪些模型训练推理优化的方法
5.为什么有了 SFT 之后还需要 RLHF
6 .PPO 和 DPO 的主要思想是什么
7.代码:23.合并 K 个升序链表
全部评论
相关推荐
12-17 14:33
门头沟学院 Java 点赞 评论 收藏
分享
查看20道真题和解析