夸克大模型算法面经
1.项目介绍
2.讲讲你对 transformer 的了解
3.有哪些常用的解码策略, topp 和 topk 的具体细节,以及实现上的差别
4. 意图分流的 agent 怎么做微调的,用了多少数据
5.如何做 embedding 微调的,如何构造正负样例,训练的 loss 是什么
6.RAG有哪些可优化的地方
7.你的 RAG 项目中用到了 agent 吗,一般 agent 会用在RAG 链路中的哪些部分
8.做 sft 时是怎么做数据配比的,参数具体怎么设置的
9.RLHF的流程,有没有训过 PPO
10. deepseed 的原理,zero1,2,3怎么做的
11.了解过排序模型吗,讲几个经典的排序模型吧
12.说一下 vllm 部署8*7B的 MOE 模型每秒大概能推多少
token
13.对比学习了解吗,讲一下(比较突然,不知道为啥要问)
14.code :实现rand5到rand7
2.讲讲你对 transformer 的了解
3.有哪些常用的解码策略, topp 和 topk 的具体细节,以及实现上的差别
4. 意图分流的 agent 怎么做微调的,用了多少数据
5.如何做 embedding 微调的,如何构造正负样例,训练的 loss 是什么
6.RAG有哪些可优化的地方
7.你的 RAG 项目中用到了 agent 吗,一般 agent 会用在RAG 链路中的哪些部分
8.做 sft 时是怎么做数据配比的,参数具体怎么设置的
9.RLHF的流程,有没有训过 PPO
10. deepseed 的原理,zero1,2,3怎么做的
11.了解过排序模型吗,讲几个经典的排序模型吧
12.说一下 vllm 部署8*7B的 MOE 模型每秒大概能推多少
token
13.对比学习了解吗,讲一下(比较突然,不知道为啥要问)
14.code :实现rand5到rand7
全部评论
求问有收到二面通知吗
大佬,这些都是八股题吗,哪些是围绕项目问的呀
相关推荐
11-04 19:37
桂林电子科技大学 运维工程师 点赞 评论 收藏
分享
点赞 评论 收藏
分享
11-03 13:11
广东东软学院 游戏后端
后端转测开第一人:再怎么劝退也没用的 某些群体总以为在一个幸存者偏差的软件上看见了极少数秋招上岸某个大厂的个例就幻想上了 事实上自己打开ssob沟通1000+连个小厂面试都没 点赞 评论 收藏
分享
查看17道真题和解析