首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
牛客824551718号
2025-03-09 23:42
已编辑
门头沟学院 算法工程师
发布于四川
关注
已关注
取消关注
水滴算法一面
#水滴春招#
主要针对项目
Clip原理
分布式DDP原理
lora微调
手撕
最大连续子数组和
判断链表是否有环
全部评论
推荐
最新
楼层
超喜欢吃香菜
门头沟学院 算法工程师
佬,为啥我一面,就15分钟左右,还进二面了,我都懵了,想知道这公司招人吗?
点赞
回复
分享
发布于 2025-04-14 13:03
湖南
c666666663
门头沟学院 自然语言处理
用时多久 佬!
点赞
回复
分享
发布于 2025-03-10 15:03
上海
暂无评论,快来抢首评~
相关推荐
2025-12-06 20:15
陕西理工大学 算法工程师
26校招淘天大模型算法二面
1.介绍自己的项目2.BLEU和ROUGE3.self-attention求内积时为啥除以根号d4.LLM的评估5.介绍下simCSE6.解决tokens不够的问题应该怎么办7.详细介绍下deepspeed(三个stage结合参数回答)8.gpt和llama的区别(模型结构上的)9.PEFT的方式,LORA论文讲一下,对比p-tuning10.LLM训练的时候为什么warmup11.对比学习中的batch size是大一些好还是小一些好(大一些,甚至可以到10k+,为12.了构造好的negative样本)13.了解最新技术一般怎么通过什么渠道14.代码题:lc347 前 K 个高频元素
查看13道真题和解析
点赞
评论
收藏
分享
2025-12-01 00:10
北京大学 算法工程师
美团大模型应用秋招一面
1. 实习项目问的很细,数据构造,微调参数等2. 如果子agent回复不对怎么办?反思?跳不出去怎么办?限制次数3. LORA和全参数微调的区别4. DPO,PPO,GRPO5. 逻辑回归、XGB和神经网络的区别6. XGB怎么做特征重要性的?gini系数是什么?7. Deepseek MLA?为什么压缩?8. Transformer encoder?为什么需要FFN?9. AUC物理意义,公式,公式含义code:重排链表
查看10道真题和解析
点赞
评论
收藏
分享
2025-12-18 09:20
北京大学 算法工程师
字节大模型校招二面面经
实习介绍——5min项目相关细节提问——5min1. 了解 DeepSpeed 吗?训练时用 ZeRO 优化主要是解决啥问题?ZeRO 的三个阶段分别都是啥?2. TP 或 PP 了解吗?3. 并行训练时,如果模型参数量不大,怎么决定用 PP 还是 TP 策略?它们各自有啥好坏?4. 如果用 TP=2 的策略,self-attention 层里的 QKV 矩阵具体是怎么切分的?5. 用 TP 的时候,主要会发生哪些通信?不同的切分方式会改变通信行为吗?举个例子呗。6. 讲讲 Flash Attention 的原理,矩阵 tiling 的过程说细一点,最好把 shape 也讲清楚。手撕算法:经典接雨水+最长上升子序列
点赞
评论
收藏
分享
2025-12-18 06:25
上海交通大学 算法工程师
腾讯混元大模型二面-秋招面经
1.自我介绍,过实习和论文2.知道哪些强化学习算法,除了 PPO和 DPO 这些呢3. 知道 LoRA 的原理吗, A 和 B 两个矩阵怎么初始化,有了解过其他的初始化方法吗4.除了 DeepSpeed ,还用过其他的什么优化方法吗5.ZeRO -1, ZeRO -2,ZeRO -3三个模式的区别6.讲一下 RLHF 的流程,之前有用 RLHF 做过模型对齐吗7.当时你用 DeepSpeed ZeRO -3来微调Qwen2-72B,每一张卡占用的显存大概是多少,估算一下为什么是占这么多的显存8. 在微调 Qwen 的时候,数据是怎么构造的9.代码:无重复字符的最长子串
点赞
评论
收藏
分享
2025-12-18 17:25
山东大学 算法工程师
阿里实习大模型算法一面
1. Encoder与Decoder中注意力机制存在哪些差异?2. 注意力机制的计算流程是怎样的,为何在计算时要除以根号下Dk,掩码注意力机制又是怎样达成的?3. 阐述GQA、MQA、MLA的原理分别是什么。4. 位置编码的必要性体现在哪里,为何选用sin_cos函数进行位置编码?5. 询问之前实习中Agent的设计思路,以及所提创新方法的实现方式。6. 提及使用DeepSpeed开展SFT训练,请说明DeepSpeed ZeRO Stage 1 - 3的不同之处,以及何种情况下使用FSDP更为合适。7. 询问Agent工具的设计情况,是否采用workflow形式。8. 了解哪些Agent开发框架,像langchain和LlamaIndex,它们的核心应用场景有何区别?9. 针对数据输入输出格式,为保证大模型输出稳定json格式,采取了哪些措施?10. 若Agent推理API需要低延迟响应,会从哪些方面开展系统级优化工作?11. 代码考察:给出LeetCode第34题,在排序数组中查找元素的第一个和最后一个位置
点赞
评论
收藏
分享
一键发评
Clip原理详细讲讲
已老实
忍耐王
DDP实现难点在哪
lora微调效果如何
评论
点赞成功,聊一聊 >
点赞
2
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
双非非科班2年时间的转码历程
3.2W
2
...
简历挂麻了?因为你的简历只有“宽度”没有“深度”!
1.1W
3
...
入职第一天:允许自己像个新生
9090
4
...
26秋招小结 含面经碎碎念版
5194
5
...
师门闯关记①:好学姐我听你的,就选你说的那个导师了
4195
6
...
百度java一面 28届的第一次大厂面试 感觉g了
3917
7
...
实习不忙被公司要求下周再来
3596
8
...
嵌入式学习路线分享
3419
9
...
双非老鼠的悲惨秋招
3042
10
...
“CRUD”正在消亡吗,2026该何去何从
3002
创作者周榜
更多
正在热议
更多
#
26年哪些行业会变好/更差
#
13518次浏览
179人参与
#
卷__卷不过你们,只能卷__了
#
6778次浏览
159人参与
#
MiniMax求职进展汇总
#
211次浏览
4人参与
#
去年的flag与今年的小目标
#
6492次浏览
155人参与
#
哪些公司在招寒假实习?
#
7037次浏览
83人参与
#
有深度的简历长什么样?
#
12419次浏览
262人参与
#
机械人的秋招小目标
#
25791次浏览
226人参与
#
现在前端的就业环境真的很差吗
#
488001次浏览
5881人参与
#
写论文的崩溃时刻
#
3372次浏览
99人参与
#
入职第一天
#
7604次浏览
149人参与
#
你不能接受的企业文化有哪些
#
7248次浏览
122人参与
#
央国企投递记录
#
170082次浏览
1633人参与
#
腾讯音乐求职进展汇总
#
146984次浏览
1042人参与
#
你都用AI做什么
#
4757次浏览
112人参与
#
实习教会我的事
#
48553次浏览
359人参与
#
一人分享一道面试手撕题
#
16382次浏览
671人参与
#
秋招白月光
#
645600次浏览
5008人参与
#
一人一道大厂面试题
#
112042次浏览
1253人参与
#
应届生应该先就业还是先择业
#
163328次浏览
828人参与
#
实习,不懂就问
#
148558次浏览
1337人参与
#
新凯来求职进展汇总
#
67102次浏览
174人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务