正实现的小目标

02-10 16:20 上海交通大学算法工程师

关注

日常实习字节多模态大模型算法二面

攒人品中，有面试过同岗的朋友欢迎评论区交流
1.llava1.6的改进
2.qwen23vl的改进
3.手撕MHA
4.DPO与PPO的区别
5.GRPO如何计算相对R
6.GRPO为什么要对重要性ratio进行clip
7.为什么要除以根号Dk
8.为什么注意力操作是qkv三个向量
9.一般通过什么方式进行知识的学习
10.看过什么技术报告

全部评论

推荐最新楼层

南京大学算法工程师

手撕MHA细节？

点赞回复分享

发布于 03-15 18:41 北京

门头沟学院算法工程师

佬面的是哪个部门呀

点赞回复分享

发布于 02-11 01:43 湖北

03-05 08:56

广东工业大学推荐算法

27届后端简历求拷打

27届研二，无实习经历，想找一个暑期/日常的后端实习，投了很多厂，都没回应，求拷打是什么问题引流：字节跳动、腾讯、美团、百度、拼多多、阿里

下水道鼠鼠ne：怎么那么像我室友😂，卧槽盒

点赞评论收藏

分享

03-16 23:25

门头沟学院机器学习

字节日常实习大模型算法二面

有面试过同岗的朋友欢迎评论区交流1.深挖多模态和大模型的论文2.Decoder文本生成有哪几种方法3.还知道哪些多模态大模型4.介绍一下ALBEF、BLIP5.BLIP2的结构是什么 两阶段怎么训练的 有哪些损失6.知道PEFT吗 讲一下LoRA7.还有什么微调方法 -> prefix-tuning和P-tuning 两者分别是怎么做的 为了解决什么提出的

点赞评论收藏

分享

03-04 12:53

门头沟学院机器学习

字节大模型算法二面难死了...

祝大家都能拿到满意的Offer！1. 项目拷打2. 详细阐述Transformer的底层原理，并说明其能够替代RNN的核心优势；结合Transformer架构的成熟度，分析Self-Attention机制在多模态对齐任务中是否存在瓶颈，以及在实际业务场景中，是否出现过注意力权重完全偏移的情况。3. 讲解LoRA的技术原理，说明LoRA是否仅能嵌入Linear层；分析LoRA无法在LayerNorm层之后插入的原因，以及该操作会对模型训练稳定性产生哪些具体影响。4. 结合实操经验，说明QLoRA降低训练资源成本的核心逻辑；列举常见的模型量化方式，并解释QLoRA选择NF4与FP16组合而非其他方案的原因，阐述NF4的分布拟合逻辑。5. 针对采用multi-query attention优化后，decoder延迟仍居高不下的问题，分析潜在性能瓶颈；探讨vLLM自带的KV Cache是否会成为推理过程中的负担。6. 分别说明Embedding模型与Rerank模型处理文本语料的核心流程，并结合实际应用场景举例说明。7. 结合过往RAG项目经验，讲解从数据清洗到检索服务上线的完整链路搭建流程，重点说明chunk切分的具体策略。8. 分析当前RAG技术落地的最大瓶颈，并阐述你在项目中采取过哪些优化手段来提升检索召回率（Recall）。9. 针对XX领域大模型的训练工作，说明SFT（监督微调）数据集的构造方法与核心思路。10. 结合LoRA微调实操经历，说明rank值的选择依据；在合并adapter权重的过程中，是否遇到过梯度爆炸问题，以及对应的解决方法。11. 结合你的模型部署相关经验，说明模型参数量与硬件算力需求之间的对应关系（例如不同参数量级模型所需的算力配置标准）；以部署一个稀疏率千分之三的235B参数量MOE架构模型为例，估算其所需的算力规模。12. 在搭建RAG知识库时，若需对文档进行动态更新，你采用的是全量嵌入还是增量处理方案？若为增量处理，如何规避新旧文档数据分布不一致导致的检索偏差问题。13. 针对机械臂动作态融合相关工作，说明数据融合的具体实现方案，以及对比实验的设计思路与评估指标。

查看12道真题和解析

点赞评论收藏

分享

03-18 11:15

门头沟学院推荐算法

字节AI大模型算法二面

多模态模型横向对比除了 Video-LLaMA，还了解哪些主流多模态大模型？→ 常见的有 LLaVA、Flamingo、BLIP、BLIP-2、KOSMOS、PaLI 等简单介绍 ALBEF 和 BLIP 这两个模型的核心设计→ ALBEF：基于图像 - 文本对比学习，搭配动量蒸馏来优化图文对齐效果；BLIP：引入 captioner 生成高质量图文对，再结合 filter 机制筛选优质数据BLIP-2 的整体结构是什么？两阶段训练流程是怎样的？用到了哪些损失函数？→ 结构：在 ViT 和大语言模型之间插入 Q-Former 作为中间桥梁→ Stage1：冻结 ViT 和语言模型，只训练中间的 Q-Former→ Stage2：冻结语言模型，将 Q-Former 与 LM 连接，做指令微调→ 损失：ITC（图文对比损失）+ ITM（图文匹配损失）+ LM 生成损失微调方法（PEFT 全家桶）了解 PEFT 吗？再讲讲 LoRA，重点说明低秩假设的合理性→ PEFT 是参数高效微调的统称，核心是只训练少量参数而不动原模型权重；LoRA 假设模型权重更新量 ΔW 具有低秩特性，将其分解为 A×B，只训练 A、B 两个低秩矩阵，既节省显存又能保留效果除了 LoRA，还有哪些 PEFT 方法？Prefix-tuning 和 P-tuning 有什么区别？→ 其他方法：Adapter Tuning、Prefix-tuning、P-tuning、IA³ 等→ Prefix-tuning：在输入序列前加可学习的 prefix，作用于注意力的 K/V 矩阵，更适合 decoder-only 架构→ P-tuning：用小型网络（如 LSTM）生成连续的 soft prompt，解决离散 prompt 不稳定的问题，更适配 encoder-decoder 模型大模型训练范式你项目中用到的大模型结构是什么？多模态特征是如何喂给大模型的？→ 示例流程：视频帧 → TimeSformer 提取时空特征 → 特征池化 → 线性投影对齐到文本维度 → 拼接到文本 prompt 之前 → 输入 LLM大模型在做了指令微调后，为什么还需要 RLHF？→ 指令微调只是让模型学会遵循指令，但输出可能更偏向 “模板化”；RLHF 是通过人类偏好对齐，让模型输出更符合人类价值观、更自然、更有用的回答，解决 “有用性” 和 “安全性” 问题了解 RLHF 吗？描述它的完整训练流程→ 三阶段流程：① SFT 微调：用高质量指令数据对预训练模型做监督微调，让模型学会基本指令遵循② 训练 Reward Model（RM）：用人类标注的偏好数据训练奖励模型，学习给不同模型输出打分③ PPO 优化：用 RM 作为奖励信号，通过 PPO 算法更新策略模型，最大化 RM 给出的奖励，实现与人类偏好对齐手撕 LeetCode 原题：合并 k 个升序链表→ 核心思路：用小根堆维护 k 个链表的当前节点，每次弹出最小值节点并入结果链表，再将该节点的下一个节点入堆，直到所有链表遍历完毕；时间复杂度 O (N log k)，N 为总节点数

查看9道真题和解析

点赞评论收藏

分享

03-18 01:20

门头沟学院推荐算法

字节多模态大模型二面日常实习

攒攒人品！有面试过同岗的朋友欢迎评论区交流1.项目拷打2.论文拷打3.介绍transformer 架构4.BLIP2的结构是什么，两阶段怎么训练的，有哪些损失5.知道 PEFT 吗，讲一下 LoRA6.LoRA 是什么，有什么好处7.Transformer 怎么做加速训练，训练和推理有什么区别8.一些场景题

查看7道真题和解析

点赞评论收藏

分享

评论

1

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你觉得大几开始实习最合适？ #

15258次浏览 172人参与

# uu们，春招你还来吗？ #

52693次浏览 304人参与

# 厦门银行科技岗值不值得投 #

13781次浏览 311人参与

# 面试被问到不会的问题，你怎么应对？ #

12751次浏览 163人参与

# 面试中，你被问过哪些奇葩问题？ #

92268次浏览 891人参与

# Claude Code泄露源码 #

7119次浏览 111人参与

# 开放七大实习专项，百度暑期实习值得冲吗 #

35315次浏览 616人参与

# 恒生电子笔试 #

17529次浏览 135人参与

# 2023年不发年终奖的公司盘点 #

30294次浏览 174人参与

# 你都用vibe coding做过什么？ #

9222次浏览 387人参与

# AI Coding实战技巧 #

7829次浏览 173人参与

# 26届春招投递记录 #

1496次浏览 24人参与

# 你现在一天AI几次？ #

6559次浏览 87人参与

# 七猫笔试 #

6355次浏览 46人参与

# 做完笔试后你收到面试了吗？ #

14255次浏览 165人参与

# 四大天坑是哪四家？ #

111174次浏览 241人参与

# 你见过哪些招聘隐形歧视？ #

11038次浏览 98人参与

# 机械人你知道哪些单休企业 #

101812次浏览 476人参与

# Vibe Coding 会干掉初级岗位吗？ #

12320次浏览 168人参与

# 大厂实习和小厂实习最大的区别是什么？ #

25028次浏览 194人参与

# 如果人生可以debug你会改哪一行? #

5653次浏览 102人参与

# 网易游戏雷火笔试 #

3961次浏览 66人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务