【25暑期实习】好未来大模型一面
40分钟左右,面试官很温柔
整体流程如下:
自我介绍
大模型实习项目介绍
手撕multi head self-attention
熟悉哪些微调方法
代码中除根号d的原因
知道哪些norm方式
layer norm与batch norm的区别
pre跟post norm的区别
自由提问
团队介绍
1. 大模型:mathgpt,做数学题
2. 进去做 rlhf,这个方向目前3-4人
3. 业务岗,不以发paper 为目的,但可以发
4. 算力:1k多卡的h800,不可自由使用
5. 希望尽快到岗
整体流程如下:
自我介绍
大模型实习项目介绍
手撕multi head self-attention
熟悉哪些微调方法
代码中除根号d的原因
知道哪些norm方式
layer norm与batch norm的区别
pre跟post norm的区别
自由提问
团队介绍
1. 大模型:mathgpt,做数学题
2. 进去做 rlhf,这个方向目前3-4人
3. 业务岗,不以发paper 为目的,但可以发
4. 算力:1k多卡的h800,不可自由使用
5. 希望尽快到岗
全部评论
暑期实习还是日常实习啊,好未来的暑期怎么投递?
哥们咋还和另一个大佬取情侣名呢,都是冲大模型的北大✌️,关注一波期待大模型面经了只能!
相关推荐
xiaowl:你这个简历“条目上”都比较有深度性,但是实际上面试官又没法很好的评估你是怎么达到很多看上去很厉害的结果的。要避免一些看上去很厉害的包装,比如高效的内存复用策略的表达,如果仅是简单的一些内存共享机制,而且面试上也没有深挖的空间,就不要这样表达。比如,工程化模式本质上可能就是定义了一些abstract class,那也就没特别多值得讲的内容。建议简历上应该侧重那些你花了大量时间和精力解决、研究的问题,不要过分追求“丰富”,而是关注在技术深入度、问题解决能力的表现上。 点赞 评论 收藏
分享
