10-28 19:02 门头沟学院推荐算法

关注

阿里夸克大模型一面面经

1.怎么保证 pretrain数据的质量；
2. 重 RL 和重 SFT 你倾向于哪个？
3. 分布均匀的硬币，分布均匀的话是我抛这枚硬币，我得到正面和反面的概率都是 0.5，这很好理解嘛，因为它是分布均匀的。现在我的问题是我抛了两次，已知其中有一次是正面，我想知道另外一次也是正面的概率是多少？
4.我有一副标准的扑克牌，这标标准扑克牌是 54 张牌，里面大小王各一张。现在我要把这副标准的扑克牌随机的、均匀的分给三个人，我想知道大小王在同一个人手上的概率是多少？
5.我有十个小球，五个红色，五个绿色。十个小球五红五绿。现在我把这十个小球放在两个完全一样的盒子里。然后我的目标是有人从这两个盒子里面随机的取一个盒子，随机的取一个球，他取到红球的概率最大。那问我应该用什么样的方法把我这十个球放在两个盒子里面？

全部评论

推荐最新楼层

中南大学 Web前端

这段面经我在小红书上刷到过一个一模一样的。。。是同一个人吗？

点赞回复分享

发布于 10-29 01:51 北京

10-19 21:40

门头沟学院推荐算法

快手大模型二面

1.自我介绍 2.讲一下你的自动化评估体系是怎么设计的吧 3. markdown转html做报告验证，那你这个合法性是怎么判断合法的？是直接看渲染结果吗？那怎么做自动验证的？ 4.你说截图验证，那你这个截图是怎么生成的？怎么知道截图渲染的是正确的 5. Agent 推荐比赛的提示词优化流程讲一下，是怎么构造出更优提示词的 6.你这个提示词优化迭代里面，比如说你怎么判断当前生成提示词就是“最优 7. 刚刚说“反思机制”有个模块，那我想问问这个反思机制是怎么做的？是类似 Chain of Thought 吗？有没有自动修正能力？ 8.帮我实现一下Transformer 里面的多头注意力你能现场实现...

查看21道真题和解析

点赞评论收藏

分享

10-29 16:45

门头沟学院推荐算法

字节多模态大模型一面面经

1.自我介绍和过项目2.知道 deepspeed 和 megatron 吗，分别介绍一下3.Decoder 文本生成有哪几种方法4.Attention 为什么要做scaled ，不做会怎么样，为什么用根号 d _ k5.说一下 Decoder 的因果注意力， QKV 分别来自哪6.深挖多模态大模型论文用的video - llama ，讲一下大模型的结构7.LoRA 初始化怎么做的，用的秩是多少，为什么不选其他的数8. 介绍一下 ALBEF 、 BLIP

查看8道真题和解析

点赞评论收藏

分享

10-31 21:20

门头沟学院 Java

阿里智能信息后端开发一面

1、数据库进行分库分表场景下，生成全局唯一的分布式 ID有哪些方法？ 2、谈谈雪花算法的底层实现 3、谈谈项目 1 做了什么事，自己负责了什么工作（5 min） 4、手撕做题：一个字符串 s 和一个整数 k，找出 s 中的最长子串，要求该子串中的每一个字符出现次数都不少于 k，返回这个子串的长度。比如 s = "ababbc", k = 2，则输出结果为 5。因为最长子串为 "ababb"，其中 a 出现 2 次，b 出现 3 次，均不少于 k 5、谈谈当前写法的时间复杂度是多少？ 6、思考一下基于滑动窗口能否实现？代码怎么写？ 7、手撕做题：写一个线程安全的单例模式 8、谈谈饿汉式单例和懒汉...

点赞评论收藏

分享

11-02 06:10

门头沟学院 Java

美团大模型二面面经

1.详细说一下dns解析它是怎么解析的，过程咋样2.Transformer你给我讲讲它底层原理，讲一下它为啥能替代RNN，我们知道Transformer架构已经很成熟了，但你觉得它的Self-Attention机制在多模态对齐上会不会存在瓶颈？有没有实际场景里注意力权重完全偏掉的情况3.说下LoRA的原理吧，LoRA是不是只能在Linear层插？你有没有了解过为什么不能插在LayerNorm之后？这会对训练稳定性造成什么影响4.你刚才提到用过QLoRA，那你能具体说说QLoRA是怎么降低资源成本的吗？常见的量化方式有哪些，QLoRA为什么选的是NF4和FP16这组组合，而不是别的组合？你能说说NF4 的分布拟合逻辑吗5.我们做了一些multi-query attention优化，但发现decoder延迟还是高，你觉得是哪里的瓶颈vLLM 本身的KV cache 是不是反而是负担7. Embedding模型和Rerank模型分别是怎么处理文本语料的？用场景举一下例子8.看你做过RAG，讲讲从数据清洗到检索服务上线这整个链路是怎么搭的，你是怎么做chunk切分的10.你觉得当前RAG的最大瓶颈在哪？你做过哪些改进来提升 Recall11.你们在训练xx领域大模型的时候，SFT 数据怎么构造12.看你做过LoRA微调，那你是怎么选rank值的？合并adapter权重的时候有没有遇到梯度爆炸13.我看你这个特长里面也有写过使用这个模型部署是吧你也做过相关模型部署的工作，那咱们能简要的说一下，我们部署的参数量模型部署的参数量，然后还有它对应的硬件之间的需求关系，比如说我每个参数量的模型所需要的算力需求大概是什么？先给出一个题吧，我们部署一个MOE架构的千分三的235b的一个模型，他所需要的算力大概是多少？14. 比如rag知识库搭建就是比如说我们在搭建这个知识库的时候，需要对这个知识库的文件文档进行动态更新了，那么你之前是用的是全量嵌入还是增量处理？如果是用增量的话，那么怎么来避免新旧文档的文单的分布不一致导致的这种检索偏差的问题15.你那个机械臂的那个动作态这一块融合的这一块，然后你那个具体的数据是怎么进行一个融合的，然后这个对比协议是怎么做的16.在做多模态融合的时候，有没有做过过视觉跟文本之间的对齐任务，怎么做的

查看14道真题和解析

点赞评论收藏

分享

10-21 22:15

门头沟学院推荐算法

阿里通义实验室大模型算法一面面经

1.自我介绍 2. Lora 原理（核心是低秩分解：将原始权重更新近似为两个低秩矩阵乘积，减少参数量，保留主导方向，训练高效） 3.了解 DeepSpeed 吗， ZeRO -1, ZeRO -2和 ZeRO -3分别做了哪些优化 （1 优化优化器状态，2 优化梯度，3 切分参数，全面节省显存） 4. Qwen的模型结构是怎么样的，相比于 LLaMA, DeepSeek 有什么区别（Qwen采用GQA+SwiGLU+RMSNorm，和LLaMA架构非常相似，差异在训练数据和tokenizer中文支持更好；DeepSeek只用MoE/ MLA架构，Qwen系列主要是Dense模型） 5.怎么缓解...

查看11道真题和解析

点赞评论收藏

分享

评论

点赞

4

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 2025秋招体验点评 #

1228次浏览 22人参与

# 说说你知道的学历厂 #

359862次浏览 1294人参与

# 京东开奖 #

488792次浏览 2728人参与

# 简历无回复，你会继续海投还是优化再投？ #

105910次浏览 828人参与

# 外包能不能当跳板？ #

49386次浏览 249人参与

# 校招薪资来揭秘 #

6882次浏览 37人参与

# 360集团校招 #

25536次浏览 178人参与

# 联影医疗求职进展汇总 #

15194次浏览 76人参与

# 秋招什么时候开投比较合适？ #

113473次浏览 815人参与

# 距离放假还有_天，我已经…… #

28892次浏览 321人参与

# 本机械人被这些公司泡过池子 #

38840次浏览 185人参与

# 机械只有转码才有出路吗？ #

147618次浏览 1638人参与

# CVTE求职进展汇总 #

24831次浏览 323人参与

# 中核求职进展汇总 #

30074次浏览 193人参与

# 提前批过来人的忠告 #

136589次浏览 1318人参与

# 学历or实习经历，哪个更重要 #

193929次浏览 1032人参与

# 海康威视工作体验 #

47328次浏览 158人参与

# 第一份工作能做外包吗？ #

78956次浏览 551人参与

# 同bg的你秋招战况如何？ #

178206次浏览 1047人参与

# 24届软件开发秋招薪资爆料 #

393717次浏览 1258人参与

# 哪些公司校招卡第一学历 #

222123次浏览 780人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务