美团大模型算法日常实习一面65min
1. 挑一个实习项目介绍
2. 实习:介绍框架,pipeline如何搭建,后续主要围绕pipeline中的问题进行提问和确认。
3. 项目:介绍了自己的工作内容和项目工作流程
4. 八股
- (1)DeepSeek-R1训练流程(2)介绍GRPO算法:reward / advantadge、group(3)有没有了解过GRPO的改进算法,挑其中一个讲一下
- 了解哪些主流模型架构,Qwen 1~3是否有了解,挑其中一个来讲一下,答了没怎么了解过,又问了我了解哪些开源大模型,回答了Kimi K2和Kimi Researcher,然后着重讲了Kimi K2
- 了解过MHA和GQA吗,讲一下原理和区别
- 了解位置编码吗,讲一下Rope
5. 手撕:最接近三数之和
2. 实习:介绍框架,pipeline如何搭建,后续主要围绕pipeline中的问题进行提问和确认。
3. 项目:介绍了自己的工作内容和项目工作流程
4. 八股
- (1)DeepSeek-R1训练流程(2)介绍GRPO算法:reward / advantadge、group(3)有没有了解过GRPO的改进算法,挑其中一个讲一下
- 了解哪些主流模型架构,Qwen 1~3是否有了解,挑其中一个来讲一下,答了没怎么了解过,又问了我了解哪些开源大模型,回答了Kimi K2和Kimi Researcher,然后着重讲了Kimi K2
- 了解过MHA和GQA吗,讲一下原理和区别
- 了解位置编码吗,讲一下Rope
5. 手撕:最接近三数之和
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
12-14 14:24
杭州电子科技大学 Java 点赞 评论 收藏
分享
查看18道真题和解析