字节校招记录贴
8.18一面
主要是讲自己做的项目。讲完时间差不多了,也就没问其他的了。
8.21 二面
先讲项目 大约40分钟。
然后是基础问答
1.ZeRO的介绍,有什么办法优化ZeRO3的通信。
2.HBM. DRAM SRAM有什么关系。
3. FlashAttention,就简单讲了一下原理,没推公式。
4. attention里最费内存的操作是哪个。
5. 旋转编码器和普通位置编码的不同。
6. 大模型投机采样的原理。
7. 手撕,挺简单的。
问HR结果,HR没回复,挺焦灼的。希望有个好结果吧。
也从这个面试中发现,光看着自己的一亩三分地了,对大模型的研究没有及时更新,比如投机采样这种应用比较广的方法我都不是特别清楚,只知道个大概。 之后需要每天花点时间追踪一下学术前沿。
25.08.22 HR回信,pending了,看看其他岗叭,冲冲冲!
主要是讲自己做的项目。讲完时间差不多了,也就没问其他的了。
8.21 二面
先讲项目 大约40分钟。
然后是基础问答
1.ZeRO的介绍,有什么办法优化ZeRO3的通信。
2.HBM. DRAM SRAM有什么关系。
3. FlashAttention,就简单讲了一下原理,没推公式。
4. attention里最费内存的操作是哪个。
5. 旋转编码器和普通位置编码的不同。
6. 大模型投机采样的原理。
7. 手撕,挺简单的。
问HR结果,HR没回复,挺焦灼的。希望有个好结果吧。
也从这个面试中发现,光看着自己的一亩三分地了,对大模型的研究没有及时更新,比如投机采样这种应用比较广的方法我都不是特别清楚,只知道个大概。 之后需要每天花点时间追踪一下学术前沿。
25.08.22 HR回信,pending了,看看其他岗叭,冲冲冲!
全部评论
实习吗,什么岗位呀,ai infra 还是算法呀
我二面结束两天了,没消息,好慌呀
相关推荐
xiaolihuam...:rand7实现rand5,这面试官真是没活了

点赞 评论 收藏
分享
点赞 评论 收藏
分享