美团大模型应用算法 一面

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.为什么用sft,不用强化学习?能不能直接强化学习?
2.为什么要用强化学习对齐,SFT为什么不能对齐?
3.为什么要微调,提示词不行吗?(针对金融项目lora微调)
4.vllm显存占用是怎样的?观察哪些vllm的指标来优化显存的?
5.大模型lora训练时需要设置哪些参数?
6.训练时观察的指标有什么?如何知道是过拟合,欠拟合?
7.如何训练的?一次训练好的吗?
8.Flash attention ,page attention原理。
9.强化学习有自己训练过吗?
10.算法手撕:中序遍历二叉树
全部评论

相关推荐

评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务