小红书LLM算法一面 55min
1️⃣ 自我介绍
2️⃣dpo训练对于系统问答的优化在哪里
3️⃣提高模型的准确率核心是什么
4️⃣rerank 用的什么模型
5️⃣swiGLU 的改进
6️⃣全参数微调 7B 需要多少显存
7️⃣FP16/BF16 区别
8️⃣介绍 gradient checkpoint
9️⃣RougeL 计算方法
1️⃣0️⃣代码:找数组第 k 大元素
2️⃣dpo训练对于系统问答的优化在哪里
3️⃣提高模型的准确率核心是什么
4️⃣rerank 用的什么模型
5️⃣swiGLU 的改进
6️⃣全参数微调 7B 需要多少显存
7️⃣FP16/BF16 区别
8️⃣介绍 gradient checkpoint
9️⃣RougeL 计算方法
1️⃣0️⃣代码:找数组第 k 大元素
全部评论
相关推荐
01-16 11:50
浙江工商大学 Java 点赞 评论 收藏
分享
01-25 07:09
门头沟学院 Java 点赞 评论 收藏
分享
查看9道真题和解析 点赞 评论 收藏
分享
