小红书搜推算法日常实习一面凉经分享

感觉面完人都通透了,还是太菜了,下去沉淀一下
项目拷打
拷打第一段实习
2.1 模型优化细节,非常细,基线模型结构、具体优化点、expert数量,输入维度,参数量计算,特征分配策略等等2
2.2 参数量增加后,计算量增加了多少?FLOPs和训练速度分别怎么变化?
2.3 模型性能跟模型大小是相关的吗?
2.4 新增的存储属于什么类型?在PS中仅增加存储是否影响训练推理速度
2.5 存储成本和查询成本哪个更高?新增参数量是否达到瓶颈?
2.6 相同的机器下,训练速度慢了多少?或者增加了多少机器才能让训练速度持平?
拷打第二段实习
3.1 主模型细节,序列建模细节,模型参数、序列长度
3.2 OneTrans的优缺点
手撕代码:求数组中第K大的数,时间复杂度要求O(N)
全部评论

相关推荐

不愿透露姓名的神秘牛友
04-30 18:05
空屿编号:你把墨镜摘下来是不是这样😭
点赞 评论 收藏
分享
评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务