26实习淘天大模型二面 凉凉
给我面没招了,感觉自己好菜、面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.实习介绍
2.了解 Transformer 吗,编码器和解码器的注意力有什么区别
3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始Transformer有哪些结构上的改动
4. 了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么
5.介绍一下 CLIP,还了解什么其他的对比学习方法
6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么
7.代码:1143.最长公共子序列
1.实习介绍
2.了解 Transformer 吗,编码器和解码器的注意力有什么区别
3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始Transformer有哪些结构上的改动
4. 了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么
5.介绍一下 CLIP,还了解什么其他的对比学习方法
6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么
7.代码:1143.最长公共子序列
全部评论
相关推荐
02-04 16:13
门头沟学院 算法工程师 字节抖音风控部门大模型算法一面1.自我介绍(论文、实习、项目)2.拷打项目(问的很细,占据主要面试时间)3.实习介绍4.讲讲dpo与kto的区别5.grpo的非规则奖励如何设计6.两道medium力扣
查看6道真题和解析 点赞 评论 收藏
分享