小米秋招算法凉经
基本是围绕项目展开的八股文
1.做微调的时候,如何选择基模
2.在lora训练的时候,用多少资源,用的什么卡,占用多少显存,一个模型有哪些模块是占用显存的,分别分析一下占用大小
3.了解rag的embedding模块吗,有哪些embedding模型,求向量相似度的方法有哪些
4.讲一下rag的全流程
5.grpo相比于sft的优势是什么
6.什么是grpo dapo gspo,这些模型的优点是什么
7. 手撕:x的立方根
1.做微调的时候,如何选择基模
2.在lora训练的时候,用多少资源,用的什么卡,占用多少显存,一个模型有哪些模块是占用显存的,分别分析一下占用大小
3.了解rag的embedding模块吗,有哪些embedding模型,求向量相似度的方法有哪些
4.讲一下rag的全流程
5.grpo相比于sft的优势是什么
6.什么是grpo dapo gspo,这些模型的优点是什么
7. 手撕:x的立方根
全部评论
相关推荐
点赞 评论 收藏
分享

腾讯成长空间 1197人发布
查看8道真题和解析