阿里控股LLM一面面经

1. 问项目,问的很细
2. 问论文亮点
3. dapo的改进有哪些?
4. lora原理?
5. 推理分为哪两个阶段?(prefill和decode两个阶段)
6. self attention怎么做的?(qkv含义+计算流程)
7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)
无手撕
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务