阶跃星辰大模型算法实习一面

1.实习介绍+项目吟唱

2.八股吟唱(部分不记得了)近20分钟
2.1 RL相关:
1.GAE是什么?
2.蒙特卡洛模拟和时序差分估计的区别?
3.偏差和方差是什么?
4.GRPO的优势值是什么?怎么算?baseline是什么?
5.RL训练MoE架构时的问题?怎么改进?问GSPO?
6.DeepSpeed框架了解吗?
7.Adam的公式是什么?
8.Adam一阶矩、二阶矩和梯度更新是怎么算的?

2.2 计算机基础:
1.指针是什么?
2.指针的长度是多少?
3.考了一道指针的算法题,关于赋值的。
4.BF16和FP16的区别?
5.bit和byte的关系
6.什么是时间复杂度?
7.GPU死锁是什么?
8.排序算法的一般的时间复杂度,并举例几个排序算法
9.介绍一下快排,什么时候出现最差情况?为什么一般不会出现最差的情况?
10.什么是动态规划?举个经典例子
全部评论
感觉这问的还好,整体难度不大
点赞 回复 分享
发布于 02-08 16:30 陕西

相关推荐

05-13 00:41
已编辑
北京邮电大学 Java
理性的杰克刷牛客:ai肯定要有的,最好学一下agent方向加一个智能客服什么的进去,并且多加点什么skill,mcp啥的,另外你现在的项目深度有些浅,这些功能都太简单了,而且也不是真正能扛高并发的实现,没有什么太大的亮点,可以去网上找点更有深度的项目。可以先投一些中小厂,有实习经历以后再去大厂,你现在这个大厂可能机会不大
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务