26校招美团大模型二面45min

1.实习介绍和讲论文讲实习,多模态大模型是否有接触?落地案例?
2.介绍一下 Qwen布的这几版模型,都做了哪些贡献,包括数据、模型和训练
3.DeepSeek 有了解吗, DeepSeek 用到的 MLA 注意力是怎么做的?它可以直接用 RoPE 吗?为什么不能,它做了哪些优化
4.了解大模型的解码策略吗,简要说一说吧
5.现有一个能力较弱的多模态模型和一个能力较强的文本模型(如 DeepSeek-R1),如何结合两者的能力来回答与多模态相关的问题?
6.代码:199.二叉树的右视图
7.反问环节
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务