米哈游大模型算法 实习面经

发点面经攒攒人品~
1.项目拷打
2.你如何评估大模型的性能?有哪些常用的评估指标?
3.请描述一下你如何对大模型进行优化,以提高其性能和效率。
4.你是否有过使用或开发大模型的经验?请分享一个具体的案例。
5.大模型中的注意力机制是如何工作的?它在大模型中起到了什么作用?
6.大模型中的优化算法有哪些常见的选择?它们各有什么优缺点?
7.如何处理大模型训练过程中的梯度消失或梯度爆炸问题?
8.在大模型设计中,如何权衡模型的复杂度和性能?
9.面对大模型训练和推理所需的庞大计算资源,你有什么解决建议?
10.请简述你了解的大模型的主要结构特点。
11.reward bench上的reward model分哪几类?
12. reward model如何训练的,训练目标是什么?
13.dp0训练的损失函数和训练目标,dpo如何改进怎么理解大模型安全,包含哪些方面的内容?
14.指令跟随能力的评估集有什么,如何评估的?
15.阿尔法狗强化学习策略是什么?提升推理能力和指令跟随能力哪个更难, 为什么, 提升指令跟随能力的优化方式和其他的比如推理有什么不一样的地方?
16.dpo训完了一般输出长度会变化吗? 如何解决这个问题大模型训练过程学习率一般是怎么变化的, 退火阶段学习率如何变化的?
全部评论
大佬这是暑期还是日常实习啊
点赞 回复 分享
发布于 03-19 16:37 天津
可以问下bg吗
点赞 回复 分享
发布于 03-17 18:25 上海

相关推荐

04-22 16:17
已编辑
电子科技大学 算法工程师
看了大家不少面经,我也发发面经攒人品✉️投递:3.18💬面试:一面 3.23 二面 3.25 三面 4.3 HR面 4.13📝offer:4.21🎙️我的感受:我由于测评不高,面到HR面的时候非常的焦虑,很怕因为测评给我挂了我投的淘天全挂了,可能就是因为测评不行吧总体下来阿里的面试官还是挺尊重的,拷打的很详细bg:双九,一段小厂对口实习面试主要内容狠狠拷打简历,实习内容,问的非常详细,会问到你负责了什么,用了多少张卡,学习率怎么样,训练了多久,用了多少数据,数据是怎么准备的,显存占用怎么样场景题:如果我目前有一个数字人的模型,我想训练成只生成一个人的,可以怎么做你看过什么别的 SOTA 模型的 ref image 注入方式,有什么优劣八股:如何判断模型是否收敛如果训练的时候梯度消失或者爆炸,你怎么解决如何系统判断是否训练完成,特别是在视频生成模型中有哪些常见的蒸馏方法LoRA 微调的原理DiT 的框架流程,如何时间注入,讲一讲 AdaLN讲一下 flow Matching,原理,优势现在为什么大家都用 RMSNorm 而不是 LayerNormAdam 和 AdamW 的原理,有什么改进手撕:1. 二叉树的右视图2. 非 hot 100,滑动窗口3. 扎破所有气球的最少箭数暑期实习还是太折磨了,我面了好多场,一直在泡池子。。。腾讯二面给我泡了13天然后挂,米哈游一面挂,快手简历挂。。。看到身边同学都拿到offer了,那是一个焦虑啊,本来都想转日常了。最后总算是有一个结果了
查看15道真题和解析
点赞 评论 收藏
分享
评论
3
10
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务