【25暑期实习】好未来大模型一面

40分钟左右,面试官很温柔

整体流程如下:
自我介绍
大模型实习项目介绍
手撕multi head self-attention
熟悉哪些微调方法
代码中除根号d的原因
知道哪些norm方式
layer norm与batch norm的区别
pre跟post norm的区别
自由提问

团队介绍
1. 大模型:mathgpt,做数学题
2. 进去做 rlhf,这个方向目前3-4人
3. 业务岗,不以发paper 为目的,但可以发
4. 算力:1k多卡的h800,不可自由使用
5. 希望尽快到岗
全部评论
哥们咋还和另一个大佬取情侣名呢,都是冲大模型的北大✌️,关注一波期待大模型面经了只能!
点赞 回复
分享
发布于 04-03 07:49 广东
暑期实习还是日常实习啊,好未来的暑期怎么投递?
点赞 回复
分享
发布于 04-26 16:23 辽宁
联易融
校招火热招聘中
官网直投

相关推荐

点赞 14 评论
分享
牛客网
牛客企业服务