唯品会大模型二面凉经
1. 讲一下大模型从0到1的训练过程
2. 为什么不能跳过SFT去做RLHF
3. 有哪些提高predict质量的方法(self-consist、cot、few-shot等)
4. 在pretrain中同时有代码和文字知识,在SFT时学习新的代码和文字知识哪个更难?(从pretrain的指标(PPL)上分析)
5. 在做训练时出现复读现象如何debug?怎么解决推理时的重复现象?
另外求教一下第2题是为什么🧐 #实习,投递多份简历没人回复怎么办# #实习,投递多份简历没人回复怎么办# #牛客解忧铺# #牛客在线求职答疑中心# #不给转正的实习,你还去吗# #大模型#
2. 为什么不能跳过SFT去做RLHF
3. 有哪些提高predict质量的方法(self-consist、cot、few-shot等)
4. 在pretrain中同时有代码和文字知识,在SFT时学习新的代码和文字知识哪个更难?(从pretrain的指标(PPL)上分析)
5. 在做训练时出现复读现象如何debug?怎么解决推理时的重复现象?
另外求教一下第2题是为什么🧐 #实习,投递多份简历没人回复怎么办# #实习,投递多份简历没人回复怎么办# #牛客解忧铺# #牛客在线求职答疑中心# #不给转正的实习,你还去吗# #大模型#
全部评论
相关推荐
点赞 评论 收藏
分享
04-03 10:26
中国矿业大学 Java 二十岁的编程男神王大...:兄弟,到岗时间你说的多少呀,我们导师只能要求六月走,感觉说六月会不会给挂了offer
查看4道真题和解析 点赞 评论 收藏
分享
