顺丰 大模型一面
📍面试公司:顺丰
🕐面试时间:9.29
💻面试岗位:大模型 一面
❓面试问题:
1.自我介绍
2.实习-微调上下文长度是多少?
3.实习-微调数据集多少?
4.实习-用的什么卡训练?什么框架,训练多长时间?
5.实习-显存优化框架是什么?
6.实习-deepseed zero用的什么?zero 1 2 3 有什么区别,介绍一下
7.如果使用zero2,全参微调8B模型,精度BF16,占用多少显存?模型占用多少,梯度占用多少,优化器占用多少(这一块答得挺差的)
8.实习-PPO训练使用几张卡
9.实习-PPO有多个模型,如何加载的,SFT占用了几张卡?(这一块答得更差)
10.实习-PPO训练框架?
11.实习-为什么不使用RAG?使用Agent的框架吗?
12.讲一下vllm的prefix cache
13.vllm 并发量很高的时候,什么机制去解决?(就是一次解决不完,不会)
14.讲一下vllm和SGlang的结构化输出(不会)
反问:
1.业务:问答机器人,把很多很多的机器人整合为一个,涉及到多路查询、query重写、实例抽取,微调和langchain。还有一些多模型搜索的业务等
2.技术栈:模型微调+agent
🙌面试感想:训练问的好多,我不会
#发面经攒人品#
🕐面试时间:9.29
💻面试岗位:大模型 一面
❓面试问题:
1.自我介绍
2.实习-微调上下文长度是多少?
3.实习-微调数据集多少?
4.实习-用的什么卡训练?什么框架,训练多长时间?
5.实习-显存优化框架是什么?
6.实习-deepseed zero用的什么?zero 1 2 3 有什么区别,介绍一下
7.如果使用zero2,全参微调8B模型,精度BF16,占用多少显存?模型占用多少,梯度占用多少,优化器占用多少(这一块答得挺差的)
8.实习-PPO训练使用几张卡
9.实习-PPO有多个模型,如何加载的,SFT占用了几张卡?(这一块答得更差)
10.实习-PPO训练框架?
11.实习-为什么不使用RAG?使用Agent的框架吗?
12.讲一下vllm的prefix cache
13.vllm 并发量很高的时候,什么机制去解决?(就是一次解决不完,不会)
14.讲一下vllm和SGlang的结构化输出(不会)
反问:
1.业务:问答机器人,把很多很多的机器人整合为一个,涉及到多路查询、query重写、实例抽取,微调和langchain。还有一些多模型搜索的业务等
2.技术栈:模型微调+agent
🙌面试感想:训练问的好多,我不会
#发面经攒人品#
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享