12-06 23:15 陕西师范大学算法工程师

关注

百度多模态算法实习一面

1、先询问了我实习时长、文章署名、实习意愿等问题
2、先介绍一个最擅长的项目（这里最好准备一个ppt，我讲解了我的一篇
3、论文的模型细节
4、各个模块的motivation
5、对于某一个模块有无做实验验证
6、Vision transformer的创新点
7、Swin transformer的创新点
8、Resnet的核心idea
9、为什么用transformer不用CNN
10、另一篇论文负责的部分以及贡献
11、对于多模态大模型有哪些了解
12、Mamba的创新是什么，对后面的演化路径有哪些了解
13、问一个算法比赛的获奖比例

全部评论

推荐最新楼层

12-07 16:05

滴滴出行_前端研发实习生(实习员工)

7天10面来分享一下我的11月面筋！

开头先来整点小感悟这次从滴滴离职之后花了两个礼拜多一点进行了个菜鸟康复训练八股算法手撕啥的还真是四个月没学 忘得一塌糊涂之后又用了七天时间差不多面了10场本小红书梦女拿到🍠offer后就没有再面啦一直忘记整了 这次趁周末整理完秉着开源精神来分享一下我的面筋~汇总如下：虾皮 一面✅️二面✅️hr✅️oc✅️哈啰 一面✅️笔试放弃做了但是莫名其妙说oc✅️了贝壳 一面✅️二面诡异至极 无后续米哈游 一面✅️二面拒了小红书 一面✅️二面✅️（我是🍠梦女）百度 一面无后续（面试体验特烂无比 至少我觉得我的表现没有问题）这次感觉面试都以问实习居多，需要对实习的产出有比较深入的理解感觉主要可以从为什么...

Pomelooooo：佬带带我

面试问题记录

点赞评论收藏

分享

11-20 18:15

山东大学算法工程师

阿里通义大模型算法二面已凉凉

1.实习介绍2. Lora 原理(核心是低秩分解:将原始权重更新近似为两个低秩矩阵乘积，减少参数量，保留主导方向，训练高效)3.了解 DeepSpeed 吗，ZeRO -1, ZeRO -2和 ZeRO3分别做了哪些优化(1优化优化器状态，2优化梯度，3切分参数，全面节省显存)4. Qwen的模型结构是怎么样的，相比于 LLaMA,DeepSeek 有什么区别(Qwen采用GQA+SwiGLU+RMSNorm，和LLaMA架构非常相似，差异在训练数据和tokenizer中文支持更好;DeepSeek只用MoE/MLA架构，Qwen系列主要是Dense模型)5.怎么缓解大模型的幻觉问题(RAG，RLHF对齐，事实监督)6.大模型的 MoE 结构相比于 Dense 结构训练的难点在什么地方，DeepSeekMoE为什么效果好，有什么值得我们借鉴创新点(MoE面临负载不均衡、训练不稳定问题;DeepSeekMoE通过细粒度专家和共享专家设计提升稳定性和效果)7.知道FP16和BF16有什么区别吗，包括FP32和INT8这些，在训练大模型的时候，应该怎么选择(FP16精度高但易溢出，BF16动态范围大;训练常用BF16混合精度，推理用INT8量化加速)8.讲-下 RLHF 的流程，写-下 PPO和 DPO的 Loss表达式(训练奖励模型后用PPO/DPO优化策略:PPO Loss: policy ratio + KL 约束/ DPO Loss: logit preference diff + sigmoid binary loss)9.对于超长上下文业界一般是怎么做的，你知道 Qwen是怎么做的吗(业界常用ROPE 变体/滑动窗口注意力/稀疏注意力等:Qwen使用YaRN和窗口注意力扩展上下文)10.开放题:你觉得目前大模型的上限在哪里(推理能力、长期记忆、具身交互和能耗效率，需要架构创新和多模态融合突破)11.代码:152.乘积最大子数组

查看9道真题和解析

点赞评论收藏

分享

12-11 17:20

合肥工业大学算法工程师

26校招百度推荐算法二面

1. 第一段实习的核心任务与业务目标分别是什么？2. 四塔多目标方案相较经典双塔在 CTR/跨类目召回上带来哪些可量化收益？3. 离线样本构造、天级更新流程及线上特征滞后补偿机制如何设计？4. 用户塔输入特征列表中，哪些对跨类目效果拉动最大？上线后除 AUC 还重点监控哪些业务指标？5. 多模态向量维度规模多大？全量推涨后提升显著的根因分析结论是什么？6. 商品塔接入多模态 encoder 后为何离线指标下滑？定位到哪个环节？7. 第二段实习的特征清洗链路如何缩短 40%？混合负采样的 hard 比例与动态策略、loss、激活函数分别如何选型并对比？8. 是否尝试过 MMoE 等专家网络？专家数量与推理延迟增量各是多少？9. 推荐场景下除 dropout 外的两种过拟合抑制手段10.Transformer 各子层功能及去掉 FFN 的影响11. 编码：在已排序数组中用 O(log n) 实现目标值的左右边界查找

查看11道真题和解析

点赞评论收藏

分享

12-12 19:15

山东大学算法工程师

滴滴26秋招算法二面

八股文: 1.为什么图像要划分 patch，对应物理含义，对比联系 nlp 文本2.不同 loss 应用任务场景，解释 loss 怎么算3.lora 原理，初始化，为什么，对比 sft4.图像分割任务数据少，不同场景数量不均衡怎么解决，过拟合欠拟合，怎么解决，除了加数据呢，除了改loss 呢(还说了数据增强)5.训练网络过程的一些优化6.batchnorm和layernorm 区别，为什么用，在哪里用7.attention 及其变体原理，cross attention 的 qkv 来自哪里8.其他的记不太起来了，都是基于简历和组内业务的延伸好像，总结来说都不难，简历拷打内容:1.自述最得意的 paper 和实习*1，你觉得你做得最好的一点在哪里,2.期间穿插模块细节询问，实现手段，觉得有什么问题，怎么改进，3.询问自己做的一个小 demo，各个模块设置的动机，然后开始压力我

查看10道真题和解析

点赞评论收藏

分享

12-12 14:15

陕西理工大学算法工程师

百度校招文心一言Agent算法二面

1.CV 和 NLP 的区别与联系2.在Transformer 框架下，CV、NLP、语音是否可能“大一统”3.大模型训练：数据清洗、处理、配比的方法4.大模型训练：如何更容易提升模型性能5.什么是大模型的幻觉，如何缓解6.为什么会有复读问题，业内有哪些解决办法7.工具与 Agent：大模型工具调用的实现方式8.工具与 Agent：Agent 的组成部分及实现方法9.开放题：你在大模型训练中遇到过的困难，如何解决？10.代码题：实现一个Tokenizer

查看10道真题和解析

点赞评论收藏

分享

评论

点赞

收藏

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 摸鱼被leader发现了怎么办 #

73985次浏览 421人参与

# 工作后明白的那些道理 #

30514次浏览 339人参与

# 工作后，你落下了哪些病根 #

1415次浏览 33人参与

# 电网求职进展汇总 #

33419次浏览 90人参与

# 你学到的“最没用”的职场技能是 #

1320次浏览 28人参与

# 七夕节你打算怎么过？ #

70081次浏览 806人参与

# 业务面应该做哪些准备 #

80557次浏览 831人参与

# 国央企笔面经互助 #

172465次浏览 1211人参与

# 你见过最离谱的招聘要求是什么？ #

245528次浏览 1691人参与

# 满帮集团求职进展汇总 #

13280次浏览 95人参与

# 拼多多求职进展汇总 #

798268次浏览 6452人参与

# 上班到公司第一件事做什么？ #

113928次浏览 787人参与

# 职场破防瞬间 #

352686次浏览 2827人参与

# 工作两年想退休了 #

208275次浏览 1844人参与

# 硬件人秋招的第一个offer #

111141次浏览 1426人参与

# 国企/银行/研究所公司爆料 #

177680次浏览 889人参与

# 视觉/交互/设计招聘信息汇总 #

24422次浏览 634人参与

# 产品人求职现状 #

299185次浏览 2363人参与

# 如果可以选，你最想从事什么工作 #

672370次浏览 4848人参与

# 满分简历要如何准备？ #

249606次浏览 2961人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务