夸克大模型算法面经
1.项目介绍
2.讲讲你对 transformer 的了解
3.有哪些常用的解码策略, topp 和 topk 的具体细节,以及实现上的差别
4. 意图分流的 agent 怎么做微调的,用了多少数据
5.如何做 embedding 微调的,如何构造正负样例,训练的 loss 是什么
6.RAG有哪些可优化的地方
7.你的 RAG 项目中用到了 agent 吗,一般 agent 会用在RAG 链路中的哪些部分
8.做 sft 时是怎么做数据配比的,参数具体怎么设置的
9.RLHF的流程,有没有训过 PPO
10. deepseed 的原理,zero1,2,3怎么做的
11.了解过排序模型吗,讲几个经典的排序模型吧
12.说一下 vllm 部署8*7B的 MOE 模型每秒大概能推多少
token
13.对比学习了解吗,讲一下(比较突然,不知道为啥要问)
14.code :实现rand5到rand7
2.讲讲你对 transformer 的了解
3.有哪些常用的解码策略, topp 和 topk 的具体细节,以及实现上的差别
4. 意图分流的 agent 怎么做微调的,用了多少数据
5.如何做 embedding 微调的,如何构造正负样例,训练的 loss 是什么
6.RAG有哪些可优化的地方
7.你的 RAG 项目中用到了 agent 吗,一般 agent 会用在RAG 链路中的哪些部分
8.做 sft 时是怎么做数据配比的,参数具体怎么设置的
9.RLHF的流程,有没有训过 PPO
10. deepseed 的原理,zero1,2,3怎么做的
11.了解过排序模型吗,讲几个经典的排序模型吧
12.说一下 vllm 部署8*7B的 MOE 模型每秒大概能推多少
token
13.对比学习了解吗,讲一下(比较突然,不知道为啥要问)
14.code :实现rand5到rand7
全部评论
求问有收到二面通知吗
大佬,这些都是八股题吗,哪些是围绕项目问的呀
相关推荐
05-12 21:10
暨南大学 嵌入式软件开发 点赞 评论 收藏
分享
03-27 23:02
河南工程学院 测试开发 牛客29046817...:优化一下简历,突出重点,简历上的技能复习扎实,实习工作啥的整理成文档梳理一下怎么说要有自己的思考在里边,岗位的话运维,测试,开发,实施,技术支持能投的都投,多投递能找到的,秋招投递了3个月左右(8月中旬到11月下旬),boos打招呼8000多次,官网投递300多家,才找到一家满意的
点赞 评论 收藏
分享
04-11 10:38
电子科技大学 Java
牛客100866号技...:把电科加粗,把电科加粗,把电科加粗,两个吊车尾的项目合并成一个,再加一个管理系统。电科✌🏻在成都面中厂手拿把掐 点赞 评论 收藏
分享

华为HUAWEI工作强度 1363人发布