阿里淘天 大模型推荐 一面 凉凉

全程50min左右
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.adam优化器
3.ppo的优化目标
4.grpo对ppo的改进
5.grpo后续的改版
6.lora微调时更新了哪几个层的参数 参数r是什么用的 设为多少 有什么影响
7.dpo sft的应用场景
8.介绍注意力机制
9.介绍位置编码

手撕 限制数组长度的最大子数组和
全部评论

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务