03-21 18:25 西安交通大学算法工程师

关注

字节大模型算法一面 1h 攒人品

发点面经攒攒人品～
1.实习拷打
2.详细说一下Decoder的因果注意力 QKV分别来自哪
3.Attention为什么要做scaled 不做会怎么样为什么用根号d_k
4.Transformer怎么做加速训练（KV缓存）训练和推理有什么区别（并行化）
5.深挖多模态大模型论文用的video-llama 讲一下大模型的结构
6.论文用了CoT讲一下论文的CoT是怎么样的
7.微调用的LoRA介绍一下LoRA
8.LoRA初始化怎么做的，用的秩是多少，为什么不选其他的数
9.知道deepspeed和megatron吗？分别介绍一下
10.论文拷打

全部评论

推荐最新楼层

门头沟学院算法工程师

佬能说下哪个部分吗

点赞回复分享

发布于 03-21 21:20 辽宁

04-13 08:54

广西大学算法工程师

作业帮大模型算法开发二面

1. 大模型微调的完整技术方案与工程落地细节采用 LoRA 参数高效微调方案，仅对 Transformer 的 Q/V 投影层添加低秩矩阵，冻结底座模型参数。训练时设置秩 r=8、缩放因子 α=16，使用 AdamW 优化器，学习率 2e-4，配合余弦退火学习率调度与梯度裁剪。工程上使用混合精度训练、分布式数据并行，提升训练效率，训练后合并 LoRA 权重，不增加推理延迟。 import torch import torch.nn as nn class LoRALinear(nn.Module):def __init__(self, in_features, out_features, r=...

查看24道真题和解析

点赞评论收藏

分享

04-12 01:30

门头沟学院算法工程师

字节27实习多模态大模型二面凉经

感觉面完人都通透了，还是太菜了，下去沉淀一下1.项目拷打，每个问题都很深很细节，问到你不会为止八股：1.attention怎么算？2.QKV和softmax公式；为什么要除根号d？除d行不行？3.grpo不同模型架构上训练的差异4.ppo的value model怎么做的？和actor model输出区别。手撕ppo，grpo公式，两者核心区别，advantage怎么算，kl怎么加。最后一些数据提纯和视频生成的场景题。

查看6道真题和解析

点赞评论收藏

分享

04-14 08:50

广西大学算法工程师

快手大模型算法开发一面

1. 自我介绍2. 项目拷打3. Reward Model 在对齐训练里扮演什么角色Reward Model 本质上是在学一个“人类更偏好什么”的可微近似函数。SFT 学的是“像人那样答”，RM 学的是“人更喜欢哪种答法”。它并不直接生成答案，而是给候选答案打分，把人类偏好从离散排序信号压进一个标量目标里，后续无论是 PPO 还是其他策略优化方法，核心都要依赖这个分数去推动模型往偏好更强的方向移动。RM 最大的价值不是替代人工，而是把人工偏好从逐条监督扩展成可批量泛化的训练信号。真正难的地方在于它很容易学到表面模式，比如更长、更像模板、更会说套话的答案可能被错判成更优，所以 RM 训练的上限很...

AI-Agent面试实战...

点赞评论收藏

分享

04-10 13:10

门头沟学院 Java

字节大模型后端暑期一面 75min

继续来分享下最近的面经~欢迎友好讨论，信息共享1.prompt如何生成的2.大模型产生幻觉的原因和解决方式3.如何增强大模型的code review能力（微调模型？拆分问题报告？）4.了解openclaw么？它和其他大模型有什么不同5.用过哪些AI，cursor生成代码的底层原理是什么？如果让你设计，你会怎么做？6.Skill了解吗？MCP是什么？7.HashMap的线程安全问题是什么？多个线程同时put会发生什么？和ConcurrentHashMap的区别是什么?8.输入一个网址访问网页经过了哪些协议？整体流程是什么？9.MVCC是什么？原理是什么？它是如何作用的？10.JVM的内存区域划分？其中栈的作用是什么？11.手撕：leetcode437：路径总和

查看11道真题和解析

点赞评论收藏

分享

04-03 12:20

复旦大学算法工程师

虾皮NLP秋招补录一二三面面经排序挂

一面简历拷打1. GSPO相对于GRPO最大的区别是什么？2. LoRA在初始化的时候，有什么特殊设定？3. LoRA实际训练时，base模型的参数是固定不变的吗？4. LoRA中A和B都设置成0可以吗？5. LoRA中A和B都设置成0时，求梯度的时候一直都是0吗？手撕6.给定一个数组，求其中逆序对的个数。7.给定一个包含正数和负数的数组，求其中连续子数组的最大乘积。二面简历拷打1.为什么需要多智能体？单智能体不能做吗2.LangGraph相对其他开源智能体编排工具的优点是什么？3.在现有场景中是否需要用到LangGraph的状态管理功能？4.如何理解Long-term Memory的实现方式...

点赞评论收藏

分享

评论

3

5

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 27届实习投递记录 #

171612次浏览 1704人参与

# 拼多多集团-PDD笔试 #

113976次浏览 697人参与

# 拼多多工作体验 #

68531次浏览 465人参与

# 求职遇到的搞笑事件 #

201477次浏览 1026人参与

# 找工作时遇到的神仙HR #

1252828次浏览 5957人参与

# 体制内上岸心路历程 #

39933次浏览 231人参与

# 小米求职进展汇总 #

1084819次浏览 6551人参与

# 国庆前的秋招小结 #

305230次浏览 1758人参与

# 硬件人秋招进展 #

298174次浏览 4055人参与

# 得物app工作体验 #

71264次浏览 125人参与

# AI时代下，你的岗位要求有什么变化？ #

43403次浏览 290人参与

# 满分简历要如何准备？ #

323336次浏览 3385人参与

# 我的AI电子员工 #

45239次浏览 262人参与

# 万物皆可发面经 #

7176次浏览 88人参与

# 通信和硬件还有转码的必要吗 #

110958次浏览 648人参与

# 今年找实习到底有多难？ #

109696次浏览 501人参与

# 扒一扒那些奇葩实习经历 #

161441次浏览 1185人参与

# 26届校招投递进展 #

684167次浏览 3970人参与

# 重来一次，我还会选择这个专业吗 #

479621次浏览 4012人参与

# 秋招开始捡漏了吗 #

250998次浏览 1065人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务