阿里夸克 大模型算法暑期实习一面
继续来分享下最近的面经~欢迎友好讨论,信息共享
1.深挖项目
2.lora参数更新量的计算
3.dpo ppo grpo 的结构
4.mha gqa mqa mla的结构
5.flash attention的原理
6.贪心输出 beam search top p top k
7.大模型温度的定义
8.一道逻辑推理题 像中学奥数题
9.手撕前k高频元素
1.深挖项目
2.lora参数更新量的计算
3.dpo ppo grpo 的结构
4.mha gqa mqa mla的结构
5.flash attention的原理
6.贪心输出 beam search top p top k
7.大模型温度的定义
8.一道逻辑推理题 像中学奥数题
9.手撕前k高频元素
全部评论
相关推荐
查看12道真题和解析 点赞 评论 收藏
分享
查看9道真题和解析 点赞 评论 收藏
分享