26校招快手大模型算法一面

以下问题全部从简历出发(非八股,无参考意义)
1.pre-train怎么做的,用了哪些数据
2.说一个电商领域的数据构造方法
3.pre-train之后怎么sft的
简单说下dapo4.(我提到了用DAPO做rft)
5.dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
6.(我提到了大模型推理慢)说一下推理慢的原因
7.模型有上线吗?下游任务的业务效果如何?
8.有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
9.function-call怎么训练的,语料如何构建
手撕:最小回文串
反问:
1.which部门
2.what业务
3.当前基座研究进展
4.如果入职,工作内容是什么
全部评论

相关推荐

11-19 18:44
已编辑
成都理工大学 Java
后端offer收割:我面试过100+校招生,大厂后端面试不看ACM,竞赛经历含金量低于你有几份大厂实习 这个简历整体来看不错 可以海投
如何写一份好简历
点赞 评论 收藏
分享
10-02 19:29
已编辑
浙江科技大学 运营
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务