阿里夸克 大模型算法暑期实习一面

继续来分享下最近的面经~欢迎友好讨论,信息共享
1.深挖项目
2.lora参数更新量的计算
3.dpo ppo grpo 的结构
4.mha gqa mqa mla的结构
5.flash attention的原理
6.贪心输出 beam search top p top k
7.大模型温度的定义
8.一道逻辑推理题 像中学奥数题
9.手撕前k高频元素
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务