腾讯混元多模态一面

1️⃣自我介绍
2️⃣实习项目拷打
3️⃣科研拷打
4️⃣八股
Grpo 原理,公式,与 ppo 的区别
1.介绍其他的一些强化学习方法
2.介绍 Rope
3.为什么大模型用 decode - only 架构,为什么不用 encode - decode
4.介绍 qwen -2.5的结构
5.Sft 训练 qwen - vl -7b模型占用的显存是多少,vit 和映射层占多少显存
6.训练的时候爆显存了怎么解决
7.介绍一下 deepspeed
5️⃣手撕
1.连续数组最大和
2.搜索旋转数组
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

昨天 22:55
已编辑
南京大学 Java
面试时间:95分钟——————非技术——————1. 自我介绍2. 为什么从字节离职?3. 提转正了吗4. 字节和美团实习感受的区别?5. 开始挖美团的实习,和一面不同,这次是聚焦于一个工作展开延伸,而且问的很深,更多不是技术方面而是问为什么要做这个、如果xx怎么办,以及我自己工作中的感受和思考,是否感兴趣等等6. 自己有明确的想法吗?想做什么不想做什么7. 你认为你在美团实习的表现怎样?——————技术——————8. 抽象类和接口的区别?9. 你在实际开发中是怎么应用java的面向对象特性的?10. java并发编程中,需要前置的一些线程进行处理完之后再进行后续线程调度,怎么做?11. 自己在开发过程中用到的数据结构(说了字典树),追问其概念12. 学生考试,每个学生每门课都有考试成绩,设计库表(说了减少冗余的范式设计和留冗余换查询性能的反范式设计,追问后者具体怎么设计,答以学生id和考试id两个字段作为主键构建表,查询考生成绩时无需联表)13. sql题,查每门课的平均成绩14. 如果sql查询非常慢该怎么排查你应该知道吧(刚准备回答面试官就默认我知道直接pass了)——————代码——————15. 手撕:二叉树序列化和反序列化(之前看过一眼但很久没碰了,打算参考k神的思路做层序遍历,但是写的过程中面试官觉得我的思路不对(实际上是可以的),最后因为时间原因并没有完全写完,面试官说明白我的思路了先到这里)——————闲聊——————16. 平时是怎么学习新知识的?17. 聊了下rag18. 哪些事情会让你有热情反问:对校招生的期待,然后围绕这个又聊了一会,面试官也反向问了我对即将从事的工作的期待面试官态度非常和善,和他讲话会进行点头反馈,语气方面也不压力,体验很好。不过面试官为了控制时间,基本上问的技术问题一看我会就不让我继续说了hhh(不然我总是围着一个问题延伸出来扯好几分钟)。不过没想到的是问了很多非技术方面的问题,也没有事先特意准备过,所以基本上就是现场快速思考快速组织语言
爱吃鱼的肖恩求实习:聊天感觉就是想要了
查看18道真题和解析
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务