蚂蚁 实习大模型算法一面 1h

发点面经攒攒人品~
1.项目介绍
2.介绍实习
3.数据集使用的是公开数据集还在有自己构造数据集
大模型相关八股提问
4.分别讲一下 Dense 模型和 MoE 模型以及二者的区别
5.讲一下MoE的 路由机制是如何做的
6.训练完验证使用的是什么数据集
7.做这个工作的过程中的难点在哪
8.如何做的 SFT
9.介绍一下 PPO
10.讲一下 RAG 项目
11.分类任务常用的评测指标有哪些
12.讲一下 LoRA 微调的原理
13.A、B 矩阵怎么初始化的
14.LoRA 微调秩设置的是多少
coding
最小生成树
全部评论
强烈推荐!这个笔记写得很清晰 http://github.com/AccumulateMore/CV
1 回复 分享
发布于 昨天 07:35 广东
大佬 考不考虑我司,考虑的话可以看我主页帖子
点赞 回复 分享
发布于 今天 17:53 上海

相关推荐

评论
点赞
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务