📍面试公司:顺丰🕐面试时间:9.29💻面试岗位:大模型 一面❓面试问题:1.自我介绍2.实习-微调上下文长度是多少?3.实习-微调数据集多少?4.实习-用的什么卡训练?什么框架,训练多长时间?5.实习-显存优化框架是什么?6.实习-deepseed zero用的什么?zero 1 2 3 有什么区别,介绍一下7.如果使用zero2,全参微调8B模型,精度BF16,占用多少显存?模型占用多少,梯度占用多少,优化器占用多少(这一块答得挺差的)8.实习-PPO训练使用几张卡9.实习-PPO有多个模型,如何加载的,SFT占用了几张卡?(这一块答得更差)10.实习-PPO训练框架?11.实习-为什么不使用RAG?使用Agent的框架吗?12.讲一下vllm的prefix cache13.vllm 并发量很高的时候,什么机制去解决?(就是一次解决不完,不会)14.讲一下vllm和SGlang的结构化输出(不会)反问:1.业务:问答机器人,把很多很多的机器人整合为一个,涉及到多路查询、query重写、实例抽取,微调和langchain。还有一些多模型搜索的业务等2.技术栈:模型微调+agent🙌面试感想:训练问的好多,我不会