26实习淘天大模型二面 凉凉

给我面没招了,感觉自己好菜、面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习介绍
2.了解 Transformer 吗,编码器和解码器的注意力有什么区别
3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始Transformer有哪些结构上的改动
4. 了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么
5.介绍一下 CLIP,还了解什么其他的对比学习方法
6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么
7.代码:1143.最长公共子序列
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务