美团大模型算法一面

1.实习介绍
2.问项目
3.GRPO,DPO,PPO区别
4.LORA的秩一般是如何选取的
5.小米训练用的什么框架
6.LORA微调的原理
7.LORA为什么可以实现少量的参数完成全量微调的效果
8.手撕有效的IP地址
9.反问,组里做到餐的LLM生成餐,toC和toB
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务