阿里淘天llm算法日常实习一面
攒人品中!
1.minimind数据集怎么来的?预训练数据集是什么形式的?为什么这样设计?
2.项目指标提升多少?
3.了解qlora吗?
4.dpo和grpo区别?项目指标上又有什么区别?数据上呢?
5.为什么要做强化学习?为什么不能直接把想要的直接加sft里面从而不用rl
6.moe介绍?架构?
7.多模态模型了解过吗?
8.了解dapo吗?
9.手撕moe
1.minimind数据集怎么来的?预训练数据集是什么形式的?为什么这样设计?
2.项目指标提升多少?
3.了解qlora吗?
4.dpo和grpo区别?项目指标上又有什么区别?数据上呢?
5.为什么要做强化学习?为什么不能直接把想要的直接加sft里面从而不用rl
6.moe介绍?架构?
7.多模态模型了解过吗?
8.了解dapo吗?
9.手撕moe
全部评论
相关推荐
查看5道真题和解析