成就我的未来 - 个人主页动态 - 牛客网

02-09 16:40

中南大学算法工程师

腾讯大模型实习一面-日常实习

最近闲下来了写一些面经攒点人品1.手撕三数之和2.手撕零钱兑换3.DPO是用来干什么的，原理是什么？4.DPO的loss是怎么计算的？5.PPO中reward模型打分之后如何对不同样本进行排序？（Elo）6.用了几张卡跑的？7.用了什么显存优化的技术？8.zero1，2，3的原理？9.项目是如何进行Data Parallel的？

查看9道真题和解析

0 点赞评论收藏

分享

02-09 15:40

中南大学算法工程师

字节校招大模型算法凉经感觉是kpi

1.PPO 公式，是否可以没有 value model2.交叉熵公式？怎么计算的详细说下3.grpo 是什么，讲一下过程4.ppo 计算和 grpo 有什么不同，知道 gae 吗？5.grpo 有哪些变体？6.讲一下你对代码生成的看法，trae 中项目代码是怎么传进 llm 的知道吗？7.有直接试过 grpo 吗？有什么缺点？8.手撕：给定 n 行，每一行包括左指针、右指针和替换字符串，将指定字符串替换，如何优化？

查看8道真题和解析

0 点赞评论收藏

分享

02-09 13:00

中南大学算法工程师

字节多模态算法凉经，不知道为啥挂了...

1.实习介绍2.防止 sft 灾难性遗忘你有哪些方法？3.sft 和 rl 区别是什么？数据格式有什么区别？4.Reasoning 推理过程有做什么 rl 吗？有哪些奖励？5.rl 有哪些算法？reward 常见的有哪些任务？6.为什么现在不用 reward model？区别是什么？7.PPO 模块介绍一下，公式说一下？critical model 什么作用？8.DPO 公式介绍一下，和 sft 有什么区别？9.GRPO 少了哪些模块，如何在 GRPO 基础上防止模型波动？10.介绍位置编码，PE、ROPE，现在常用哪些？为什么现在模型上下文只到 128K，如果是你你会做哪些改进？11.高效推理了解过吗？如何做到高效推理？你知道哪些方法？12.Lora 是什么？初始化讲一下？是否能对换？还有哪些变体？13.KL散度作用是什么？推一下公式。如果是确定标签，那会有什么变化？从数学原理解释13.编辑距离，用 n 的空间复杂度，如果我要打印编辑路径，你会怎么改，在哪个地方改？基本全答上来了，手撕也很快，实在不知道为什么挂了

查看13道真题和解析

0 点赞评论收藏

分享

02-08 00:15

中南大学算法工程师

斑马智行大模型面经含答案版

攒人品中...1.  双向mamba vs 因果注意力：因果注意力平方复杂度、仅捕前文，短序列优；mamba线性复杂度、双向捕全局，适配车端低算力长序列场景。2.  shift实现：拆分不重叠窗口→固定步长移位→跨窗计算融合，通过张量切片/滚动实现，提升全局信息捕捉能力。3.  vllm注意力分数：分析过！用于定位瓶颈，通过阈值过滤无效计算、FlashAttention优化，适配车端低延迟需求。4.  prefill vs decoder阶段：prefill预处理提示词、缓存键值对；decoder逐token自回归生成，复用缓存，二者协同保障座舱交互推理效率。5.  降低prefill耗时：稀疏注意力过滤无效计算+动态批处理提GPU利用率+FlashAttention算子适配，结合车端芯片优化，耗时降35%左右。6.  两阶段耗时对比：prefill单次耗时高（随输入长度增长）；decoder单步快，总耗时受生成长度影响大，座舱场景易累计超时。7.  PPO流程：采样生成样本→奖励模型评分算优势值→裁剪约束更新参数→迭代优化，监控KL散度，适配座舱交互模型微调。8.  GRPO及变体：PPO优化版，无需价值函数、省显存；IGRPO增量更新稳训练，SGRPO融合MoE降算力，适配车端场景。

查看8道真题和解析

0 点赞评论收藏

分享

02-07 14:20

中南大学算法工程师

字节懂车帝大模型算法二面凉凉了...

虽然凉了，但是不妨碍我攒人品1.实习介绍2.工作经历中成长收获最大的点3.项目深挖：项目背景数据来源、数据格式、数据标注训练细节DPO数据如何构建4.八股：self-attention的时间复杂度GRPOGQADeepSeek技术报告中的MoE、MTP5.手撕：无序数组中找第 K大的数

查看11道真题和解析

0 点赞评论收藏

分享

02-07 03:20

中南大学算法工程师

深信服AI算法实习一面 1h

攒人品中，面过相关岗位的牛友欢迎评论区交流～1.项目拷打为主2.实习中你主要做了哪些工作3.模块设计及优化思路4.对于模型输出结果，特定案例如何修正5.置信度怎么判断6.你这边有用到哪些模型，选模型的时候有什么考量7.提示词怎么设计的，你设计提示词时有什么技巧8.最终的准确率是多少，剩下没准确的那些是什么原因9.场景题：用大模型做http数据包安全性识别，模型出现了幻觉，如果是你的话你会怎么解决

查看8道真题和解析

0 点赞评论收藏

分享

02-06 19:05

中南大学算法工程师

哈啰大模型AIGC算法校招二面

1.项目拷打为主2.大模型反思验证怎么做的3.为什么用大模型ocr，是否考虑使用传统的ocr方案4.你了解哪些基座模型5.你大模型应对的场景，是否有什么固有的缺陷6.是否有对badcase做归类7.是否有针对某一类badcase做专门优化，怎么做的8.你们做的这个业务，目标群体是哪些9.Grpo相比于其他强化学习的优势在哪10.奖励稀疏问题怎么解决11.AIGC是文生图还是图生图12.AIGC的反思验证怎么做的13.绘图具体怎么做的，绘图目标是什么14.绘图很大程度上依赖模型能力，万一模型对指令理解有问题怎么办15.绘图的“美感”是怎么体现的16.讲讲你这里的query改写17.场景题：不同的用户有不同的绘图偏好，你怎么设计系统以增大项目的普适性18.对于学术界中，AIGC图像质量相关的内容是否有了解

查看17道真题和解析

0 点赞评论收藏

分享

02-06 01:30

中南大学算法工程师

百度大模型一面-实习面经

有面试过同岗的朋友欢迎评论区交流1.实习介绍2.介绍一下了解的大模型有哪些，这些模型在结构上有什么差异3.说一下大模型常用的位置编码有哪些，各有什么优缺点4.介绍一下大模型的预训练后训练以及推理是怎么做的，并且详细问了 RLHF 的做法，包括PPO 算法的原理，以及 DPO 和PPO 的区别5.大模型的超长上下文是怎么做的，比如说 KIMI6.大模型智能体是怎么工作的，有哪些组件7.场景题:如何训练一个大模型，可以做到精确的提取摘要8.代码:股票的四个题 121.买卖股票的最佳时机 122.买卖股票的最佳时机I 123.买卖股票的最佳时机 I 188.买卖股票的最佳时机 IV

查看8道真题和解析

0 点赞评论收藏

分享

02-05 22:25

中南大学算法工程师

阿里淘天大模型实习一面分享

发面经攒人品中...欢迎评论区交流～1.项目介绍2.介绍一下 CLIP3.了解 LORA 吗，LORA 微调的原理是什么4.了解哪些多模态大模型，简要介绍几个5.BLIP 的三个损失函数分别是什么，数据是怎样清洗的6.BLIP2 相对于 BLIP 有哪些改进，BLIP3 又有哪些改进7.Qwen-VL的三个训练流程分别是什么，有什么作用8.视觉编码器和 LLM 连接时，使用 BLIP2中 O-Former 那种复杂的 Adaptor 好还是 LLaVA中简单的 MLP 好，说说各自的优缺点9.代码:实现多头自注意力

查看9道真题和解析

0 点赞评论收藏

分享

02-05 10:25

中南大学算法工程师

实习面经-字节大模型二面凉经

感觉是项目经历太浅太少了，寒假沉淀沉淀年后再战吧...1. 实习介绍2. 项目深挖3. RAG的问题与改进方案4. 在不能修改模型的情况下，如何调整模型回复风格5. 为什么大模型有few-shot能力？讲一下few-shot能力的原理6. PPO、DPO、GRPO、DAPO等RL算法的原理和区别7. 平时是否使用vibe coding？对此有什么看法？8. 手撕代码：编辑距离，分析写法的时空复杂度，有什么更优的写法

查看8道真题和解析

0 点赞评论收藏

分享

02-04 20:25

中南大学算法工程师

腾讯CDG大模型一面-日常实习

1.项目八股对于 Megatron-LM，多头注意力计算是使用的 TP 还是 PP，可以举个例子，比如说我现在注意力计算有16 个头，现在是有 4 个 gpu 做 TP，那么是如何进行实现的，是切分行还是切分列2.手撕最长递增子序列3.反问业务，对实习生的期望

查看3道真题和解析

0 点赞评论收藏

分享

02-04 09:25

中南大学算法工程师

顺丰大模型算法实习面经-八股拷打

1，介绍RAG流程，分段有没有做优化；编码模型和重排模型用了什么；Qwen3系列和bge系列的原理，Qwen3系列编码模型是怎么训练的2，RAG怎么评估，用了哪些指标；RAGAS有哪些指标，为什么不直接用库3，Agent的思想是什么，Agent包含哪些部分；介绍DeepResearch；介绍Agent怎么做任务规划和问题分解4，SFT数据集怎么构建，问题不够多样化怎么解决5，介绍LoRA原理；LoRA分支怎么初始化，为什么这么做6，self-attention公式；为什么要scaling7，介绍KV Cache；vllm是怎么加速推理8，RLHF，介绍PPO，包含多少个模型；GRPO与PPO的区别；GRPO的缺点；介绍GSPO

查看8道真题和解析

0 点赞评论收藏

分享

02-03 21:55

中南大学算法工程师

美团大模型算法实习二面

1. 项目细节：Qwen 2.5 VL的图片输入处理与Loss设计2. 项目细节：ViT的结构和原理3. 项目细节：Qwen 2.5 VL与普通Transformer结构差异4. 八股：RMSNorm与LayerNorm的区别及大模型偏好5. 算法题：LC25 K个一组反转链表6. 强化学习方法对比：GRPO、DPO、PPO、DAPO、GSPO7. 项目细节：图片如何传递给VLM并被理解

查看7道真题和解析

0 点赞评论收藏

分享

01-31 16:15

中南大学算法工程师

LLM大模型校招高频八股问题（攒人品

Transformer1- Transformer 的完整编码器-解码器架构和工作流程(完整输入输出)？2- Encoder 和 Decoder 分别适用于什么场景？3- Multi-Head Attention的数学公式和计算过程4- 为什么注意力计算要除以√d_k（缩放点积注意力的原因）5- 为什么 Transformer 用 Layer Normalization6- Layer Normalization 的位置和作用（Pre-LN vs Post-LN）7- Encoder 的 self-attention mask 机制8- Decoder 的 masked self-attention 原理9- Transformer/MHA 的参数量与计算量10- 多头注意力的"头"是什么意思？不同头是否学习到不同模式？11- 位置编码的作用和实现方式（正弦余弦编码 vs 学习式编码），为什么要引入位置编码？12- 你还了解哪些位置编码13- Transformer 相较于 CNN， LSTM 等模型的优势在哪？

0 点赞评论收藏

分享

01-31 10:30

中南大学算法工程师

快手推荐算法实习一面面经

1. word2vec，skip n-gram具体流程。2. 介绍attention的计算，self-attention和cross-attention区别。3. auc的定义，当处理正负样本不均衡的情况时，auc还适用么，请根据 tpr 和 fpr 的定义进行解释。4. 推荐链路提问，召回->粗排->精排->重排，每一步充当什么样的角色。然后就是深挖项目实习。手撕：区间合并

查看5道真题和解析

0 点赞评论收藏

分享

创作者周榜

更多

关注他的用户也关注了：

牛客网
牛客网在线编程
牛客网题解
牛客企业服务