26校招美团大模型二面45min
1.实习介绍和讲论文讲实习,多模态大模型是否有接触?落地案例?
2.介绍一下 Qwen布的这几版模型,都做了哪些贡献,包括数据、模型和训练
3.DeepSeek 有了解吗, DeepSeek 用到的 MLA 注意力是怎么做的?它可以直接用 RoPE 吗?为什么不能,它做了哪些优化
4.了解大模型的解码策略吗,简要说一说吧
5.现有一个能力较弱的多模态模型和一个能力较强的文本模型(如 DeepSeek-R1),如何结合两者的能力来回答与多模态相关的问题?
6.代码:199.二叉树的右视图
7.反问环节
2.介绍一下 Qwen布的这几版模型,都做了哪些贡献,包括数据、模型和训练
3.DeepSeek 有了解吗, DeepSeek 用到的 MLA 注意力是怎么做的?它可以直接用 RoPE 吗?为什么不能,它做了哪些优化
4.了解大模型的解码策略吗,简要说一说吧
5.现有一个能力较弱的多模态模型和一个能力较强的文本模型(如 DeepSeek-R1),如何结合两者的能力来回答与多模态相关的问题?
6.代码:199.二叉树的右视图
7.反问环节
全部评论
相关推荐
昨天 23:58
清华大学 视觉设计师 点赞 评论 收藏
分享
查看9道真题和解析
