昨天 14:10 门头沟学院推荐算法

关注

大模型算法日常实习二面-字节

攒人品中～
1.  项目里最核心的贡献是什么？怎么评估效果？
2.  对比学习中如果负样本和正样本拉不开距离（或太像了），你会怎么修改损失函数或采样策略？
3.  FlashAttention 原理：跟普通 Attention 的差异是什么？实现里 $QK^T$、Softmax、$PV$ 这几步是怎么落地的？
4.  分布式框架3D 并行与通信：怎么理解 DP/DDP？通信瓶颈一般卡在哪些环节？
5.  14B 模型，FP16 权重大概多大？训练时还要加哪些开销？如果用INT8 大概能省多少显存？
6.  `torch.contiguous()` 是干嘛的？为什么推理阶段在意内存连续性？
7.  代码题：井字棋判胜：读取 txt 井字棋（3×3）状态，判断当前玩家是否获胜。
8.  代码题：交叉熵损失：解释原理并手写实现。
9.  代码题：线性回归 SGD：推导更新公式并手写实现。

全部评论

推荐最新楼层

昨天 13:12

合肥工业大学 Java

找实习有感

boss沟通400➕了就几个要简历的无一个面试，很多要27以后的，28太难了感觉找不到实习了😓😓😓

点赞评论收藏

分享

02-21 15:47

上海交通大学算法工程师

阿里大模型一面

岗位名称：大语言模型算法面试时长：1h–1.5h自评分：8/10是否下一轮：是模型架构与基础原理目前主流大语言模型在架构设计上有哪些异同点？（追问）Decoder-only 和 Encoder-Decoder 在实际应用场景上有什么区别？介绍一下大语言模型中的注意力机制，多头相比单头注意力有何优势？（追问）如果减少头数会发生什么？是否一定性能下降？什么是大语言模型的涌现能力？目前对该现象的研究有哪些发现？（追问）涌现能力是否和模型规模线性相关？什么是 Embedding？词嵌入和句嵌入有何不同？（追问）Embedding 层是否会参与微调？为什么？大语言模型中的 Tokenization 是如...

技术必备题库

点赞评论收藏

分享

昨天 13:35

门头沟学院机器学习

字节一面大模型算法实习面经

有面试过同岗的朋友欢迎评论区交流1.  DPO 与 SFT 的区别：两者核心差异是什么？可以先做 DPO 再做 SFT 吗？为什么？2.  把 DPO 用在“第一轮对话”，你会如何构建数据集？`Prompt`、`Chosen`、`Rejected` 具体来源是什么？3.  多轮对话数据分布设计：单轮和多轮数据各占多少比例？这样配比的理由是什么？4.  DPO 多轮样本怎么采样：多轮样本如何采样？如何配比？5.  Reward Hacking现象：你怎么看待这个问题？怎么解决呢

查看5道真题和解析

点赞评论收藏

分享

昨天 09:48

吉林农业大学算法工程师

顺丰大模型开发一面

1、LoRA 微调的原理LoRA 的核心思想是不直接更新预训练模型里的原始大权重，而是在某些线性层旁边增加一个低秩更新分支，用低秩矩阵去近似权重增量。假设原始权重是 W∈Rd×k，全量微调时直接学习ΔW，LoRA 则把它写成：ΔW=BA其中A∈Rr×k，B∈Rd×r ,，(r) 是远小于 (d) 和 (k) 的秩。这样前向计算就变成：h=Wx+ΔWx=Wx+BAx实际里通常还会加缩放项：这样做的本质是认为很多下游任务对大模型权重的更新其实存在低秩结构，不需要真的去学习一个完整的大矩阵。LoRA 的优点是可训练参数少、显存占用低、训练快，而且原模型参数冻结，方便多任务切换和权重管理。2、LoRA...

查看11道真题和解析

点赞评论收藏

分享

03-11 09:14

已编辑

武汉大学后端工程师

深夜有感而发

24年6-8月，我的大三暑假，在鹅厂pcg度过了一段难忘的实习时光。那年的面试很顺利，一共面了3家offer了2家，进了组之后同事们都很好，mt是我的校友，至今仍然保持良好关系。后来我放弃了转正机会，因为觉得保研名额来之不易，我觉得硕士毕业后一定可以有更好的工作，更高的工资。可是之后发生的一切却让我始料未及。一年半过去，我会的东西变多了，却从1月起再难以通过任何一家公司的一场面试。目前的我有客户端的实习经历，有后端的知识储备，有agent相关的项目履历，且因研究生阶段师兄带着做科研对大模型相关的知识也有一定的了解。力扣刷了500题，说多不多，说少不少，反正把hot100和灵神题单1700分以下的都做了遍。但为什么自己就是通不过面试呢？客观分析的话有自己不够专精某一方面的因素，每次面试刚开始被问一个点的时候刚开始还OK，面试官接着深入拷打，我就没啥办法了，临场应变能力也不行。说白了：BFS❤️；DFS💔。另外就是自己没有一套很好的学习体系，总是拆东墙补西墙，因为某次面试被拷打项目，就疯狂准备项目相关的知识，忽略了计算机基础，结果下周的另一场面试被面试官计网OS一通轰炸。说了这么多，聊聊我目前的状态吧。很多大厂最近都开放了春招实习的投递，我目前采取的是海投策略。这周的Timeline大概就是周四要再次征战鹅厂，wxg的面试强度想必大家都了解，我也没有抱希望能过，以学习为主吧。周六的团子笔试应该可以试一下，毕竟有两次机会，而且貌似团子不咋看笔试分数？蚂蚁也发了笔试邀请，但因为阿里系今年笔试的改革，打算观望一下第一场的情况再参加。对自己下阶段的期望，就是不要怀疑自身的能力，然后客观评估自己当前的水准，持续进步。感谢大家能看完哥们的碎碎念，祝各位牛友都早日拿到理想offer，我后面也会持续更新自己的面试记录，也欢迎大家来一起交流呀

钱嘛数字而已："后来我放弃了转正机会，因为觉得保研名额来之不易"--- 转正机会明显比保研名额更来之不易。从保研的比例和大厂offer的通过率，非常容易判断。

今天你投了哪些公司？

点赞评论收藏

分享

评论

点赞

3

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 我的实习日记 #

3695527次浏览 31909人参与

# 你认为小厂实习有用吗？ #

126608次浏览 693人参与

# 你收到了哪些公司的笔试？ #

2920次浏览 13人参与

# 滴滴笔试 #

37521次浏览 213人参与

# 你现在的工作，是“成长”还是“消耗”？ #

2366次浏览 49人参与

# 在国企工作的人，躺平了吗？ #

405423次浏览 3969人参与

# 实习进度记录 #

1217820次浏览 11839人参与

# 你上一次加班是什么时候？ #

139623次浏览 780人参与

# 金三银四，你的春招进行到哪个阶段了？ #

19365次浏览 263人参与

# 字节跳动笔试 #

79535次浏览 367人参与

# 小米编程考试 #

32863次浏览 156人参与

# 2025，我想...... #

92014次浏览 675人参与

# 秋招报数：你投了多少家公司？ #

157399次浏览 960人参与

# 金融银行面经 #

101457次浏览 551人参与

# 美团笔试 #

708084次浏览 4687人参与

# AI岗位暴涨12倍，你会转AI赛道吗？ #

7489次浏览 142人参与

# 你听到的“最没用”的秋招建议 #

54025次浏览 326人参与

# 职场上哪些行为很加分？ #

338738次浏览 3767人参与

# 拼多多集团-PDD笔试 #

12133次浏览 143人参与

# 27届实习投递记录 #

1505次浏览 29人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务