阿里控股LLM一面面经

1. 问项目,问的很细
2. 问论文亮点
3. dapo的改进有哪些?
4. lora原理?
5. 推理分为哪两个阶段?(prefill和decode两个阶段)
6. self attention怎么做的?(qkv含义+计算流程)
7. 预训练模式是啥?和sft的区别?(next token prediction;区别是sft不算prompt的loss)
无手撕
全部评论
LLM是指啥呢
点赞 回复 分享
发布于 10-30 18:20 陕西

相关推荐

代码飞升_不回私信人...:啊喂笨蛋算法为什么写查找,线程池怎么放计网上去了,写动态规划真的不会被狠狠地制裁吗oi
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务