26校招快手大模型算法一面
以下问题全部从简历出发(非八股,无参考意义)
1.pre-train怎么做的,用了哪些数据
2.说一个电商领域的数据构造方法
3.pre-train之后怎么sft的
简单说下dapo4.(我提到了用DAPO做rft)
5.dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
6.(我提到了大模型推理慢)说一下推理慢的原因
7.模型有上线吗?下游任务的业务效果如何?
8.有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
9.function-call怎么训练的,语料如何构建
手撕:最小回文串
反问:
1.which部门
2.what业务
3.当前基座研究进展
4.如果入职,工作内容是什么
1.pre-train怎么做的,用了哪些数据
2.说一个电商领域的数据构造方法
3.pre-train之后怎么sft的
简单说下dapo4.(我提到了用DAPO做rft)
5.dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
6.(我提到了大模型推理慢)说一下推理慢的原因
7.模型有上线吗?下游任务的业务效果如何?
8.有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
9.function-call怎么训练的,语料如何构建
手撕:最小回文串
反问:
1.which部门
2.what业务
3.当前基座研究进展
4.如果入职,工作内容是什么
全部评论
相关推荐
点赞 评论 收藏
分享
