科大讯飞大模型算法实习一面 50min
攒人品中~~
1.介绍 Lora 的思想,为什么有效
2.DPO 的数据集来源
3.PPO 和 GRPO 的区别(损失函数的 clip 作用)
4.什么是大模型的幻觉,大模型解决幻觉的方式有哪些
5.为什么降低温度能缓解幻觉
6.你项目中 system prompt 和 user prompt 的区别
7.DeepSpeed zero-3 有什么改进
8.verl 和 vllm 你是怎么配合的,每个在项目中的作用
9.手撕:LCR 076 数组中的第 K 个最大元素
1.介绍 Lora 的思想,为什么有效
2.DPO 的数据集来源
3.PPO 和 GRPO 的区别(损失函数的 clip 作用)
4.什么是大模型的幻觉,大模型解决幻觉的方式有哪些
5.为什么降低温度能缓解幻觉
6.你项目中 system prompt 和 user prompt 的区别
7.DeepSpeed zero-3 有什么改进
8.verl 和 vllm 你是怎么配合的,每个在项目中的作用
9.手撕:LCR 076 数组中的第 K 个最大元素
全部评论
相关推荐
03-05 13:31
郑州轻工业大学 Java 在刷代码的我很纠结:这是我看到的牛客写的比较好的简历,你看他结果有数据量化,能够帮hr快速识别好坏,你的落脚点太多是在执行层面,但hr更想看到的不止你的专业能力还有其他隐形因素比如说统筹力,抗压力等等
查看图片
查看图片 点赞 评论 收藏
分享