阿里控股LLM一面面经
1. 问项目,问的很细
2. 问论文亮点
3. dapo的改进有哪些?
4. lora原理?
5. 推理分为哪两个阶段?(prefill和decode两个阶段)
6. self attention怎么做的?(qkv含义+计算流程)
7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)
无手撕
2. 问论文亮点
3. dapo的改进有哪些?
4. lora原理?
5. 推理分为哪两个阶段?(prefill和decode两个阶段)
6. self attention怎么做的?(qkv含义+计算流程)
7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)
无手撕
全部评论
相关推荐

点赞 评论 收藏
分享