阿里国际AI应用算法面经分享
面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.项目拷打
2.实习相关八股:
1.业务场景
2.sft数据如何筛选和采样 有哪些处理
3.为什么选取GRPO 优化目标是什么 GRPO的数学原理
4.奖励函数如何设计(重点拷问)
5.如何判断模型强化学习训练过程中训练质量达到要求
6.有没有出现reward hacking
7.除了这种碰巧式的奖励作弊外还有其它的奖励作弊吗
8.了解ppo和dpo吗(开始吟唱)
3.其它八股:
1.attention计算时间复杂度
2.kv cache 原理
3.gqa mla 原理
4.vllm原理
5.flash attention原理
6.稀疏注意力原理
7.如果模型推理比较慢如何排查
4.coding
rand7()表示rand10()
给定浮点数组通过向上取整和向下取整构造目标整数 求最小变化之和
最长无重复子串
1.项目拷打
2.实习相关八股:
1.业务场景
2.sft数据如何筛选和采样 有哪些处理
3.为什么选取GRPO 优化目标是什么 GRPO的数学原理
4.奖励函数如何设计(重点拷问)
5.如何判断模型强化学习训练过程中训练质量达到要求
6.有没有出现reward hacking
7.除了这种碰巧式的奖励作弊外还有其它的奖励作弊吗
8.了解ppo和dpo吗(开始吟唱)
3.其它八股:
1.attention计算时间复杂度
2.kv cache 原理
3.gqa mla 原理
4.vllm原理
5.flash attention原理
6.稀疏注意力原理
7.如果模型推理比较慢如何排查
4.coding
rand7()表示rand10()
给定浮点数组通过向上取整和向下取整构造目标整数 求最小变化之和
最长无重复子串
全部评论
相关推荐
04-21 22:01
门头沟学院 Java 鱼专:牛客上的都是幸存者,没offer能天天发吗,这些人没有任何参考价值。少看牛客,你要说在牛客看贴子学东西,也就面经有用,焦虑倒是一堆,广告倒是一堆
点赞 评论 收藏
分享
查看26道真题和解析 点赞 评论 收藏
分享
Stephen25:我也是,周一下午的hr面又延到周五了😣
点赞 评论 收藏
分享