小红书LLM算法一面 55min

1️⃣ 自我介绍
2️⃣dpo训练对于系统问答的优化在哪里
3️⃣提高模型的准确率核心是什么
4️⃣rerank 用的什么模型
5️⃣swiGLU 的改进
6️⃣全参数微调 7B 需要多少显存
7️⃣FP16/BF16 区别
8️⃣介绍 gradient checkpoint
9️⃣RougeL 计算方法
1️⃣0️⃣代码:找数组第 k 大元素
全部评论
刚刷到一个字节的面筋跟你这个问的挺像
点赞 回复 分享
发布于 01-30 16:41 北京

相关推荐

01-30 22:03
门头沟学院 Java
用微笑面对困难:我滴妈,【俩月】【实习】【主管】仨debuff吃满了,独立设计开发的项目写了绝大占比的运营板块,你独立开发,那维护、问题复盘、日志更新、bug、策划书全是自己整的? 不建议写那么大,可以从小出发更容易
点赞 评论 收藏
分享
评论
1
5
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务