小红书首页推荐算法面经 1h
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 项目拷打
2. 拷打第一段实习
2.1 模型优化细节,非常细,基线模型结构、具体优化点、expert数量,输入维度,参数量计算,特征分配策略等等
2.2 参数量增加后,计算量增加了多少?FLOPs和训练速度分别怎么变化?
2.3 模型性能跟模型大小是相关的吗?
2.4 新增的存储属于什么类型?在PS中仅增加存储是否影响训练推理速度
2.5 存储成本和查询成本哪个更高?新增参数量是否达到瓶颈?
2.6 相同的机器下,训练速度慢了多少?或者增加了多少机器才能让训练速度持平?
3. 拷打第二段实习
3.1 主模型细节,序列建模细节,模型参数、序列长度
3.2 OneTrans的优缺点
4. 手撕代码:求数组中第K大的数,时间复杂度要求O(N)
1. 项目拷打
2. 拷打第一段实习
2.1 模型优化细节,非常细,基线模型结构、具体优化点、expert数量,输入维度,参数量计算,特征分配策略等等
2.2 参数量增加后,计算量增加了多少?FLOPs和训练速度分别怎么变化?
2.3 模型性能跟模型大小是相关的吗?
2.4 新增的存储属于什么类型?在PS中仅增加存储是否影响训练推理速度
2.5 存储成本和查询成本哪个更高?新增参数量是否达到瓶颈?
2.6 相同的机器下,训练速度慢了多少?或者增加了多少机器才能让训练速度持平?
3. 拷打第二段实习
3.1 主模型细节,序列建模细节,模型参数、序列长度
3.2 OneTrans的优缺点
4. 手撕代码:求数组中第K大的数,时间复杂度要求O(N)
全部评论
大佬 考虑我司不 可以见我主页
相关推荐
03-24 22:39
中国海洋大学 Java 点赞 评论 收藏
分享
点赞 评论 收藏
分享
查看8道真题和解析 点赞 评论 收藏
分享