03-18 01:20 门头沟学院推荐算法

关注

字节多模态大模型二面日常实习

攒攒人品！有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.论文拷打
3.介绍transformer 架构
4.BLIP2的结构是什么，两阶段怎么训练的，有哪些损失
5.知道 PEFT 吗，讲一下 LoRA
6.LoRA 是什么，有什么好处
7.Transformer 怎么做加速训练，训练和推理有什么区别
8.一些场景题

全部评论

推荐最新楼层

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的似乎不多吧

点赞回复分享

发布于 03-22 22:27 北京

想不到好名字111

蚌埠坦克学院 C++

有面试过同岗的朋友欢迎评论区交流

点赞回复分享

发布于 03-19 11:44 四川

03-17 14:15

门头沟学院推荐算法

AI大模型算法，一环扣一环的拷打Transformer 基础详细介绍 Transformer 架构（Encoder-Decoder 结构、位置编码、FFN 等）Decoder 的因果注意力中，Q、K、V 分别来自哪里？→ Q 来自当前 Decoder 输入（已生成的 token 序列），K 和 V 也来自同一序列（需 mask 未来信息）Attention 为什么要 scaled？不做会怎样？为什么是√dₖ？→ 点积随 dₖ增大会让 softmax 进入饱和区，导致梯度消失；除以√dₖ可使方差稳定在 1（数学推导参考 Vaswani 论文）Transformer 如何加速推理？KV Cache 是什么？训练 vs 推理的并行性差异？→ 训练时所有 token 并行计算；推理时自回归，KV Cache 可缓存历史 K/V，避免重复计算，大幅提速多模态论文深挖（以 Video-LLaMA 为例）讲解 Video-LLaMA 的整体结构→ 视频编码器（如 ViT + Temporal Aggregator）→ 投影层（对齐文本空间）→ LLaMA 语言模型论文中 CoT（Chain-of-Thought）的具体设计？→ 在 prompt 中加入推理步骤示例（如 “视频中先看到人挥手，然后狗跑过来…”），引导模型分步作答微调 & 分布式训练微调用了 LoRA，介绍其原理→ 将权重更新 ΔW 分解为低秩矩阵 A×B，冻结原模型，只训练 A、B，大幅减少可训练参数LoRA 初始化怎么做？秩（rank）设为多少？为什么选这个值？→ A ~ N (0, σ²)，B 初始化为 0；常用 rank=8 或 16，在效果和参数量间取得平衡（实验验证）知道 DeepSpeed 和 Megatron 吗？分别说说→ DeepSpeed（微软）：主打 ZeRO 显存优化；Megatron-LM（NVIDIA）：张量并行 + 流水线并行论文用 DeepSpeed，三个 Stage（ZeRO-1/2/3）分别是什么？→ Stage1：优化器状态分片；Stage2：+ 梯度分片；Stage3：+ 模型参数分片（通信换显存）二面下一篇再写吧，力竭了

查看10道真题和解析

点赞评论收藏

分享

03-09 15:13

吉林农业大学算法工程师

AI-Agent 面试题汇总 - 大模型篇

一、大语言模型基础1. 目前主流的开源模型体系有哪些？主流开源模型体系包括：LLaMA 系、Qwen 系、GLM/ChatGLM 系、Mistral/Mixtral 系、Baichuan 系、DeepSeek 系、InternLM、Yi 等。面试里建议从以下维度比较：参数规模（7B/13B/70B…）上下文长度（8K/32K/128K…）多语言能力工具调用能力（function calling / agent）推理成本与部署难度开源协议（是否可商用）2. Prefix LM 和 Causal LM 区别是什么？Causal LM：严格自回归，token 只能看左侧历史（下三角 mask）。Pr...

AI-Agent面试实战...

点赞评论收藏

分享

03-08 16:35

门头沟学院推荐算法

腾讯多模态算法二面-实习凉经

面试很难，还是要多多练习1.项目拷打2.酣畅淋漓的技术八股...*-讲一下Wan(阿里的通义万相)的框架是什么*-是否了解MM-DiT的框架*-对于DiT，时间t是怎么注入的，AdaLN讲一下*-了不了解VideoVAE是怎么训练的，用了什么损失函数，如果重建视频不清晰可以再加什么Ioss*-KL散度具体的公式是什么样的?和交叉熵损失函数有什么区别联系*-是否了解Flowmatching，具体是怎么做的，和DDPM的优劣*-讲一下Classifier-Free Guidance*-是否了解视频后训练怎么做的，GRPO是什么*-你觉得对于训练一个视频基模，应该有哪几个流程，哪一步比较关键*-训练过多大的模型，用了多少张卡*-训练过程中是否遇到过不稳定的情况，本质上是因为什么*-是否了解混合精度，FP16和BF16的区别*-是否了解大模型训练中的几种并行(DP,PP,TP,EP)3.手撕: 经典 multi-headattention

点赞评论收藏

分享

03-17 23:09

门头沟学院 Java

Redis 如何实现延时队列

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花延时队列是一种特殊的消息队列，核心功能是让任务在指定延迟时间后被消费，广泛应用于订单超时取消、优惠券到期提醒、邮件定时发送、消息重试等场景。Redis凭借高性能、丰富的数据结构、原子性操作及持久化支持，成为实现延时队列的首选方案之一。以下详细介绍四种主流实现方法，结合原理、实现步骤、优缺点及适用场景，帮助开发者根据业务需求选择合适方案。一、基于Sorted Set（有序集合）的延时队列（最常用）核心原理Sorted Set（有序集合）的核心特性是每个元素（member）关联一...

Redis常用的数据结构

点赞评论收藏

分享

03-20 20:48

曲阜师范大学测试开发

六面字节终oc 我的暑期结束了

timeline过年前就约的年后三月份的面试2026 3.05 一面2026 3.10 二面（挂）2026 3.13 二面2026 3.16 hr面2026 3.19 口头oc2026 3.20 offer两道手撕无重复字符最长子串数组中能组成小于n的最大数字记录一下 不多写什么了 同时也感谢平台上以前发面经的佬们记录的一些手撕题目 刷一刷颇有成长

TeaYi：谢谢两位实习hr女士

我的OC时间线

点赞评论收藏

分享

评论

点赞

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 长得好看会提高面试通过率吗？ #

6443次浏览 63人参与

# 百度工作体验 #

316466次浏览 2233人参与

# 米连集团26产品管培生项目 #

8080次浏览 238人参与

# 沪漂/北漂你觉得哪个更苦？ #

2334次浏览 54人参与

# 离家近房租贵VS离家远但房租低，怎么选 #

17027次浏览 138人参与

# 你的实习产出是真实的还是包装的？ #

4220次浏览 72人参与

# MiniMax求职进展汇总 #

25971次浏览 323人参与

# AI面会问哪些问题？ #

1300次浏览 34人参与

# 春招至今，你的战绩如何？ #

17943次浏览 167人参与

# HR最不可信的一句话是__ #

1318次浏览 37人参与

# 你做过最难的笔试是哪家公司 #

1729次浏览 27人参与

# 从事AI岗需要掌握哪些技术栈？ #

866次浏览 25人参与

# 找AI工作可以去哪些公司？ #

982次浏览 17人参与

# AI时代，哪个岗位还有“活路” #

3471次浏览 63人参与

# XX请雇我工作 #

51186次浏览 172人参与

# 简历第一个项目做什么 #

32417次浏览 383人参与

# 面试被问第一学历差时该怎么回答 #

273662次浏览 2216人参与

# 不考虑薪资和职业，你最想做什么工作呢？ #

153060次浏览 889人参与

# 简历中的项目经历要怎么写？ #

311681次浏览 4305人参与

# 军工所铁饭碗 vs 互联网高薪资，你会选谁 #

8189次浏览 44人参与

# 投格力的你，拿到offer了吗？ #

178533次浏览 891人参与

# 秋招白月光 #

732480次浏览 5446人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务