美团大模型算法一面
1.实习介绍
2.问项目
3.GRPO,DPO,PPO区别
4.LORA的秩一般是如何选取的
5.小米训练用的什么框架
6.LORA微调的原理
7.LORA为什么可以实现少量的参数完成全量微调的效果
8.手撕有效的IP地址
9.反问,组里做到餐的LLM生成餐,toC和toB
2.问项目
3.GRPO,DPO,PPO区别
4.LORA的秩一般是如何选取的
5.小米训练用的什么框架
6.LORA微调的原理
7.LORA为什么可以实现少量的参数完成全量微调的效果
8.手撕有效的IP地址
9.反问,组里做到餐的LLM生成餐,toC和toB
全部评论
相关推荐
查看20道真题和解析 点赞 评论 收藏
分享
