淘天校招大模型算法二面

1.实习介绍和过项目
2.Qwen- VL 的三个训练流程分别是什么,有什么作用介绍一下 CLIP
3.后来有哪些比较经典的基于 Transformer 的语言模型, Qwen 相比于原始 Transformer 有哪些结构上的改动
4.了解 RLHF 吗, DPO 和 PPO 有什么区别, Loss 是什么样的,各自的优缺点是什么
5.了解哪些多模态大模型,简要介绍几个
6.了解 LoRA 吗, LoRA 微调的原理是什么
7.对PPO DPO GRPO计算逻辑的理解
8.代码:实现多头自注意力
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务