时间: 50min八股:1. 你理解的agent是什么2. decoder only的好处是什么3. 为什么要rlhf,为什么要对齐4. llama3怎么训练的(好奇怪的问题,别人家都问llama3用哪些技术,第一次被问是怎么训练的)5. dpo原理,为什么要用dpo,与ppo改进6. sft细节实习:1. 业务是什么2. 组内多少人3. 负责什么4. 为什么用xx技术5. 你去的时候已经做到什么样了6. 为什么用xx模型手撕:LeetCode 第十题 hard面试官问我,为什么不动笔呢,是不会吗没见过的hard臣妾是真做不到啊。看我做不出来就说先这样吧。反问:什么业务答:1. 多语言大模型预训练(怪不得会问llama3训练技术,以及很关心对齐阶段的八股)2. 多模态3. llm应用