小米日常实习大模型面经

项目介绍+拷打
1.每一步骤以后获得回答的变化,*在项目里sft和rlhf后大模型回答有什么变化,举例说明
2.sft和 rlhf的作用有什么区别
3.*sft如果用 dpo的chosen回答直接做sft的话还需要 rhf吗?
八股
1.sft有哪些方式?除了lora还有哪些?lora中为什么低秩矩阵是能够表示增量的?怎么初始化的?为什么要这么初始化?
2.ppo、grpo、dpo(critic model和rewardmodel,哪个是未来价值,组内相对优势怎么计骎算,*如果组内差距大的话会对训练有什么影响?有没有佬说一下这个怎么答
coding(二选一)
1.手撕 transformer,输入一个矩阵然后输出经过transformer块以后的结果,不能使用torch,只能使用 numpy
2.非 hot100 leetcode困难地下城游戏
全部评论

相关推荐

2025-12-10 18:25
门头沟学院 Java
1、实习介绍2、现在还在实习吗?3、对岗位有什么了解?4、正式工作是想投测开,还是其它岗位?5、腾讯实习应该是做纯开发吧?6、最开始为什么会选择开发呢?7、C++ 和 Go 有什么区别?8、实习期间遇到最大的挑战是什么?9、实习项目为什么没有选择其它编程语言呢?是你的 Mentor 来决定的吗?10、你写了 300 多篇的技术博客,是什么契机让你这么做的?10、因为你没有做过机器人相关的,那说一下你知道的,或者是现在有用过哪些 AI 相关的产品吗?11、文生图这些工具知道吗?12、我们是一个工程机械的产品,可以跟你讲一下这个是怎么工作的,你可以站在测试的角度先说一下你的理解13、自动装车的一个场景:有一台挖掘机,在它某个方位上可能有个卡车。功能:自动装车挖掘机会自动识别到哪个地方可以挖,挖完之后就会自动识别到卡车,把土倒到卡车上这样一个动作。讲一下里面可能涉及到的技术14、有使用过 DeepSeek 吗,有用它来做一些编程吗?15、Claude 在外测之前会去做一些测试。假如你是 Claude 测试开发同学,你要怎么去测这个 Claude 模型?16、从功能角度上怎么去验证?17、你会如何使用工具来提高 Claude 模型的测试效率?18、你觉得用例会有多少?19、算法题:小红的子串删除她准备删除其中一个连续子串,把剩下的前缀以及后缀拼接起来,拼接后的字符串中出现次数最多的字母的出现次数不超过 k。小红想知道,有多少种不同的删除方案?删除方案所删除子串的长度 len 必须满足 1 ≤ len ≤ n - 1,其中 n 为原字符串长度。输入描述:- 第一行输入两个正整数 n 和 k,分别代表字符串长度、需要保证的字母最大出现次数。- 第二行输入一个长度为 n 的字符串,只包含小写字母。输出描述:一个整数,代表总方案数。20、手上有拿到 其它实习和秋招的 offer 吗?都是什么岗位?
点赞 评论 收藏
分享
评论
3
12
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务