2025-11-20 18:15 山东大学算法工程师

关注

阿里通义大模型算法二面已凉凉

1.实习介绍
2. Lora 原理(核心是低秩分解:将原始权重更新近似为两个低秩矩阵乘积，减少参数量，保留主导方向，训练高效)
3.了解 DeepSpeed 吗，ZeRO -1, ZeRO -2和 ZeRO3分别做了哪些优化(1优化优化器状态，2优化梯度，3切分参数，全面节省显存)
4. Qwen的模型结构是怎么样的，相比于 LLaMA,DeepSeek 有什么区别(Qwen采用GQA+SwiGLU+RMSNorm，和LLaMA架构非常相似，差异在训练数据和tokenizer中文支持更好;DeepSeek只用MoE/MLA架构，Qwen系列主要是Dense模型)
5.怎么缓解大模型的幻觉问题(RAG，RLHF对齐，事实监督)
6.大模型的 MoE 结构相比于 Dense 结构训练的难点在什么地方，DeepSeekMoE为什么效果好，有什么值得我们借鉴创新点(MoE面临负载不均衡、训练不稳定问题;DeepSeekMoE通过细粒度专家和共享专家设计提升稳定性和效果)
7.知道FP16和BF16有什么区别吗，包括FP32和INT8这些，在训练大模型的时候，应该怎么选择(FP16精度高但易溢出，BF16动态范围大;训练常用BF16混合精度，推理用INT8量化加速)
8.讲-下 RLHF 的流程，写-下 PPO和 DPO的 Loss表达式(训练奖励模型后用PPO/DPO优化策略:PPO Loss: policy ratio + KL 约束/ DPO Loss: logit preference diff + sigmoid binary loss)
9.对于超长上下文业界一般是怎么做的，你知道 Qwen是怎么做的吗(业界常用ROPE 变体/滑动窗口注意力/稀疏注意力等:Qwen使用YaRN和窗口注意力扩展上下文)
10.开放题:你觉得目前大模型的上限在哪里(推理能力、长期记忆、具身交互和能耗效率，需要架构创新和多模态融合突破)
11.代码:152.乘积最大子数组

全部评论

推荐最新楼层

南京大学算法工程师

请问是北京么

点赞回复分享

发布于 2025-12-09 14:51 江苏

沉迷学习201909171255975

门头沟学院自然语言处理

你好，想请问下大模型的面试题怎么找啊

点赞回复分享

发布于 2025-11-24 20:25 北京

今天 16:37

已编辑

门头沟学院算法工程师

据说百度实习薪资涨到600一天了？

兄弟们，昨晚差点没睡好觉。。起因是同学群里有人扔了一张截图，说是百度今年暑期实习AI岗，一天600。我：？？？第一反应是P的。第二反应是：就算是真的，也是那种ssssp，跟我没关系。但后来问了一个去年在百度实习过的师兄，他的意思是全面涨了，只是不同岗位涨幅不同。然后我就开始疯狂考古……翻了牛客、小红书、还有几个***，拼凑出来的信息大概是：百度今年实习生薪资确实普涨，平均涨30%以上AI类岗位涨幅最大，部分核心方向最高涨幅据说有110%一天600的说法，不是空穴来风。我现在在某中厂实习，一天200，已经觉得还行。但如果百度真给600：一天600 = 我现在的3倍一个月按20天算 = 1万2实习...

点赞评论收藏

分享

05-02 17:06

长沙工业学院测试开发

带你理解求最大公因数的算法

前言:在数学学习与计算机编程中，我们经常需要计算两个数字的最大公约数。它既能简化分数计算，也是密码算法、数据运算里最 基础的常用在数学学习与计算机编程中，我们经常需要计算两个数字的最大公约数。它既能简化分数计算，也是密码算法、数据运算里最基础的常用工具。 从古至今，人们总结出两种最经典、流传最广的求解方法：更相减损术与辗转相除法。两种算法底层逻辑相通，都依靠数字公因数不变的数学规律缩小数值，但运算方式、速度效率截然不同。 本文用最简单直白的语言，不带复杂公式，一步步拆解两种算法的原理、过程与优劣对比，带你彻底看懂古人智慧与现代最优解法的区别。<1>更相减损术 #include &l...

点赞评论收藏

分享

04-19 18:50

已编辑

字节跳动_全栈开发(实习员工)

学院二本圆梦字节，提前结束暑期啦

个人背景：学院二本计科专业 大二开始实习个人经历：安克创新 、理想汽车、字节跳动碎碎念：我做事只有三分钟热度。看到进了大厂的同学，我会羡慕，也会跟着努力上进；但遇到好看的小说，我又会放下手头的事沉迷其中，之前的坚持也就中断了。我有些自卑，总觉得自己学历和外貌都不够好。之前偶然在网上受到关注，我就喜欢上了上网，因为这里有很多人认可我。但我也很在意别人的评价，偶尔看到嘲讽的言论，会触发我的自卑情绪，让我感到愤怒。有时候我会强硬地回怼，有时候又会懦弱地选择无视。我也有虚荣心。不管是拿到安克、理想还是字节的机会，我在分享的时候都会带着这份心思。我会特意强调自己学历不好，是为了衬托出过程的艰难，以此显得自己更厉害。我知道，人往往会炫耀自己缺少的东西，来掩盖内心的空洞。我总想着走捷径，不太喜欢踏踏实实地做事。找实习的时候，我花了更多时间在研究面试技巧上，而不是提升专业能力。我会反复听面试录音分析技巧，看面试教程学习怎么和不同的面试官沟通，还会每天自言自语练习语言表达，同学都觉得我有点奇怪。我的实习生涯里，侥幸和运气占了很大一部分。我总在想，如果有一天我失去了这份幸运，这些特质可能会让我一蹶不振。ps： 很多人会问我学习路线和经验 但是就像我上面说的 我的实习过程靠的很多是关键节点的运气 技术上面我可能不如很多人  所以请大家理性求助和理性参考我的回答 附上我的投递记录

我的offer在哪里...：从去年看到现在，飞升哥就是榜样

我的求职进度条

点赞评论收藏

分享

04-22 17:17

太原理工大学 Java

28届求锐评简历

投了三天boss了，就两三个要简历的，java实习都这么难找了吗

点赞评论收藏

分享

05-06 11:53

杭州电子科技大学算法工程师

华为暑期未面直接挂

起因是研一不知天高地厚，投了华为日常实习-软件开发，想着虽然没啥准备但人生第一场面试高低体验一下，结果也是理所当然喜提一面挂。后面发奋沉淀一年想要再战暑期实习（AI方向），结果投了后直接被卡在投递成功环节一个月，根本推进不到简历筛选环节，问HR说之前的面试成绩会保留，所以实习是推进不了了，只能看秋招还有没有机会了。当初到底是谁告诉我华为面评占比不重的

我的求职进度条

点赞评论收藏

分享

评论

6

27

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 这个offer值得去吗？ #

30069次浏览 212人参与

# 机械人还在等华为开奖吗？ #

339037次浏览 1652人参与

# 在爱玛，骑向未来 #

19682次浏览 388人参与

# 如果春招能重来，我会___ #

28526次浏览 281人参与

# 24秋招避雷总结 #

1019516次浏览 7097人参与

# 你会因为行情，降低找工作标准吗？ #

43944次浏览 319人参与

# 联宝杯大学生创新大赛，你的技术值得产业级答案 #

50211次浏览 778人参与

# 远程面试的尴尬瞬间 #

363660次浏览 2062人参与

# 大学最后一个寒假，我想…… #

103200次浏览 846人参与

# 机械求职避坑tips #

103591次浏览 589人参与

# 校招薪资来揭秘 #

960036次浏览 4060人参与

# 华为池子有多大 #

177756次浏览 930人参与

# 记录我的毕业季 #

4076次浏览 108人参与

# 26届春招投递记录 #

8490次浏览 71人参与

# 机械人，你的秋招第一份简历被谁挂了 #

268619次浏览 2450人参与

# 网易求职进展汇总 #

212957次浏览 1523人参与

# 刚入职就____，这样正常吗？ #

148624次浏览 709人参与

# 选择和努力，哪个更重要？ #

211658次浏览 1566人参与

# 去年你投递实习了吗？ #

32796次浏览 339人参与

# 春招前还要继续实习吗？ #

66836次浏览 330人参与

# 字节开奖 #

158951次浏览 779人参与

# 做完笔试后你收到面试了吗？ #

65209次浏览 309人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务