阿里淘天 大模型推荐 一面 凉凉
全程50min左右
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.adam优化器
3.ppo的优化目标
4.grpo对ppo的改进
5.grpo后续的改版
6.lora微调时更新了哪几个层的参数 参数r是什么用的 设为多少 有什么影响
7.dpo sft的应用场景
8.介绍注意力机制
9.介绍位置编码
手撕 限制数组长度的最大子数组和
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.adam优化器
3.ppo的优化目标
4.grpo对ppo的改进
5.grpo后续的改版
6.lora微调时更新了哪几个层的参数 参数r是什么用的 设为多少 有什么影响
7.dpo sft的应用场景
8.介绍注意力机制
9.介绍位置编码
手撕 限制数组长度的最大子数组和
全部评论
相关推荐
查看6道真题和解析