小红书LLM算法一面 55min

1️⃣ 自我介绍
2️⃣dpo训练对于系统问答的优化在哪里
3️⃣提高模型的准确率核心是什么
4️⃣rerank 用的什么模型
5️⃣swiGLU 的改进
6️⃣全参数微调 7B 需要多少显存
7️⃣FP16/BF16 区别
8️⃣介绍 gradient checkpoint
9️⃣RougeL 计算方法
1️⃣0️⃣代码:找数组第 k 大元素
全部评论
刚刷到一个字节的面筋跟你这个问的挺像
点赞 回复 分享
发布于 01-30 16:41 北京

相关推荐

01-30 09:45
燕山大学 Java
喵_coding:这种直接跑就完事了 哪有毕业了才签合同 任何offer和三方都没有的
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务