快手校招大模型算法一面
1.pre-train怎么做的,用了哪些数据
2.说一个电商领域的数据构造方法
3.pre-train之后怎么sft的
4.简单说下dapo(我提到了用DAPO做rft)
5.dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
6.(我提到了大模型推理慢)说一下推理慢的原因
7.模型有上线吗?下游任务的业务效果如何?
8.有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
9.function-call怎么训练的,语料如何构建
手撕:最小回文串
2.说一个电商领域的数据构造方法
3.pre-train之后怎么sft的
4.简单说下dapo(我提到了用DAPO做rft)
5.dapo去掉kl并且clip-higher,不会训飞掉吗?如何解决的?
6.(我提到了大模型推理慢)说一下推理慢的原因
7.模型有上线吗?下游任务的业务效果如何?
8.有对大模型做剪枝量化吗?最终线上方案是什么?部署用的什么卡?
9.function-call怎么训练的,语料如何构建
手撕:最小回文串
全部评论
相关推荐
点赞 评论 收藏
分享
查看1道真题和解析