首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
想潜水的海豚在春招
05-20 16:11
西安交通大学 算法工程师
发布于陕西
关注
已关注
取消关注
阿里高德打车多模态大模型算法岗
想问问有没有去了高德打车多模态大模型算法岗的佬们
二面结束以后多久oc 呀
我看大模型开发都出结果特别快
我是昨天下午面的,焦急等待
太想去了
全部评论
推荐
最新
楼层
能赶紧毕业找个班上吗
门头沟学院 深度学习
求面经
点赞
回复
分享
发布于 05-25 15:59
北京
暂无评论,快来抢首评~
相关推荐
06-05 16:16
郑州大学 算法工程师
提醒一下大模型面试进度为0的人,反正就这80页纸,熬夜背完就稳了!
点赞
评论
收藏
分享
06-04 21:48
中山大学 算法工程师
氛围很轻松:阿里淘天多模态大模型算法岗
✅一面1.首先是自我介绍和过项目,面试官还一起探讨项目用到的方法,可行性之类的2.介绍一下 CLIP3.了解 LoRA 吗,LoRA 微调的原理是什么4.了解哪些多模态大模型,简要介绍几个5.BLIP 的三个损失函数分别是什么,数据是怎样清洗的6.BLIP2 相对于 BLIP 有哪些改进,BLIP3 又有哪些改进7.Qwen-VL 的三个训练流程分别是什么,有什么作用8.视觉编码器和 LLM 连接时,使用 BLIP2 中 Q-Former 那种复杂的 Adaptor 好还是 LLaVA 中简单的 MLP 好,说说各自的优缺点9.代码:实现多头自注意力✴️一面比较常规,几乎都是八股问题,我觉得只要了解常见的多模态大模型都问题不大,主要还是要理解各个模型设计的动机是什么,这也是面试最喜欢考察的✅二面1.自我介绍和过项目,简要问了项目中使用某些方法的动机,以及是否会导致其他的问题2.了解 Transformer 吗,编码器和解码器的注意力有什么区别,在计算注意力中时除以 \sqrt{d_k} 的原因是什么3.后来有哪些比较经典的基于 Transformer 的语言模型,Qwen 相比于原始 Transformer 有哪些结构上的改动,Qwen2 又有哪些改进4.了解 RLHF 吗,DPO 和 PPO 有什么区别,Loss 是什么样的,各自的优缺点是什么5.介绍一下 CLIP,还了解什么其他的对比学习方法6.开放题:了解哪些多模态大模型,目前多模态大模型最大的问题是什么7.代码:1143. 最长公共子序列✴️二面其实也偏常规,几乎也都是八股问题,但是也考察了一些对模型的理解以及知识面的广度,整体来说比一面的难度大一些✅三面1.自我介绍,然后详细过了一下项目2.了解哪些大模型和多模态大模型,然后就聊了大模型这一路是怎么发展过来的,Transformer、BERT、GPT、LLaMA、Qwen 这些,以及当时的 o1 推理模型3.平常有尝试过训练过大模型吗,规模小一点的也没关系4.聊天,包括职业规划等等✴️三面比较轻松,面试官说知识点前面两面都考察过了,三面就轻松一些,大概40来分钟吧📳**************************************。
查看20道真题和解析
点赞
评论
收藏
分享
05-29 01:04
已编辑
郑州大学 Java
暑期实习Offer选择,字节还是美团?
字节-算力基础设施:听面试官说是负责APP应用的底层算力支持,和APP相比算是一种幕前和幕后的关系?没有搞太懂,但感觉业务面有点窄,感觉搞的是基础架构方面的东西吧。美团-核心本地商业-业务研发平台:做的是卖票方面的业务,因为需要和第三方企业做对接,所以既是To B又是To C。 我个人的看法是字节的岗位感觉不太能够和需求联系起来,感觉像是完全的To B,后面如果想跳的话,可能选择不多,但是又感觉字节的tittle更大一点;美团的这个至少是有具体的业务在的,感觉对以后的发展会好一点。两个都是暑期实习,听字节的hr说他们这个部门转正率挺高的,不过美团的转正率也高,这个是大家都知道的,个人有点纠结,...
投递美团等公司10个岗位 >
点赞
评论
收藏
分享
05-28 20:13
中山大学 算法工程师
强度拉满:网易大模型算法岗
1️⃣一面时间:9.12 时长:1hcode:统计岛屿数量、最大岛屿面积,DFS方法解了然后介绍实习项目,面试官非常耐心地听,没有打断八股1.bert和gpt的区别?(从模型架构、训练方式、使用场景方面回答的)2.训练/微调一个LLM的流程?3.实习时用的 megatron 框架吗,对分布式训练框架了解多少?(回答了deepspeed和megatron区别,以及几种并行方式,以及deepspeed的三种zero)4.了解强化学习吗,跟SFT有什么区别?5.反问:业务,对岗位的期望💣评价:有点紧张,算法题有一个小失误没注意到2️⃣二面时间:9.14 时长:1h八股1.写一下 attention 公式(代码实现了下)2.训练时为什么要mask,推理时也需要吗?两处有什么区别?推理时的sequence length和训练时一样吗3.transformer和传统seq2seq模型有什么区别?4.计算attention时为什么要除以d_k,这个d_k的含义是?5.attention计算时还有哪些scale处理?6.attention中softmax函数作用、公式、为什么有减去最大值的处理?换个函数还能这样处理吗?7.解释数值上溢、下溢问题8.讲一下prompt书写的经验,如何判断prompt是否达标,如何改进prompt9.讲一下SFT,会对哪部分计算loss?为什么?10.讲一下deepspeed11.训练用一个7b模型要占用多少显存?不同zero阶段能够节省多少显存?12.训练模型时用了几张卡,有遇到什么异常中断问题吗?反问: 在乎候选人什么能力?对面试表现有哪些改进意见?💣评价: 基础不够扎实,网上有的知识都能回答上来,在同龄人里算比较优秀,欠缺一些多机多卡实践经验。
查看17道真题和解析
点赞
评论
收藏
分享
06-04 16:38
郑州大学 算法工程师
面试字节大模型(LLMs)RAG面被问麻了~
LORA 原理:解释 LORA(Low-RankAdaptation)的核心思想,如何通过低秩矩阵实现参数高效微调?数学形式如何表达?Self-Attention机制:自注意力机制中 O/K/ 矩阵的作用是什么?如何通过缩放点积计算注意力权重?公式推导并解释Softmax 的意义。位置编码:Transformer为何需要位置编码?主流 LLM(如 LLaMA、GPT)使用哪种位置编码(如 ROPE)?相比绝对/相对位置编码有何优势?Seq2Seg 模型:Seq2Seq模型的核心组件是什么?Encoder-Decoder结构如何解决长程依赖问题?RAG技术:RAG(检索增强生成)的完整链路包含哪...
点赞
评论
收藏
分享
一键发评
二面多久出结果
接好运
爱信等
mark收藏
作者面经求分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
这一次我要拿回失去的一切...
2.6W
2
...
暑假还要上课,实习怎么办😭
7668
TP-LINK开奖
热聊中
3
...
25校招 双非硕 拿下大厂🐧
7069
4
...
一文详解各大厂人才项目差异点(吐血整理)
5681
5
...
所以毕业就是分手季吗?
5528
6
...
从竞赛到实习:我的成长之路与经验分享
4544
7
...
毕业前被解约了,我该何去何从。。
3743
8
...
27届勇闯小米!
3059
9
...
遇上了人机hr...有一样的吗
2899
10
...
华为招聘状态码更新通知脚本 2025最新版
2673
创作者周榜
更多
正在热议
更多
#
为了找工作你投递了多少公司?
#
3050次浏览
21人参与
#
小米提前批笔试难吗
#
33016次浏览
352人参与
#
一人一个landing小技巧
#
75861次浏览
1090人参与
#
聊聊这家公司值得去吗
#
220362次浏览
2088人参与
#
写给毕业5年后的自己
#
11169次浏览
207人参与
#
入职第一天,你准备什么时候下班
#
53729次浏览
339人参与
#
硬件人你反向读研了吗
#
41450次浏览
626人参与
#
正在实习的你,几点下班
#
155311次浏览
1080人参与
#
担心入职之后被发现很菜怎么办
#
125690次浏览
747人参与
#
校招入职后的感受
#
273673次浏览
2661人参与
#
大家每天通勤多久?
#
41665次浏览
326人参与
#
夸夸我的求职搭子
#
191901次浏览
1895人参与
#
体制内上岸心路历程
#
26468次浏览
212人参与
#
实习吐槽大会
#
51252次浏览
241人参与
#
我的租房踩坑经历
#
43646次浏览
398人参与
#
小米硬件提前批进度交流
#
166522次浏览
1519人参与
#
投格力的你,拿到offer了吗?
#
82296次浏览
572人参与
#
我和mentor的爱恨情仇
#
47149次浏览
296人参与
#
产品实习,你更倾向大公司or小公司
#
150663次浏览
1932人参与
#
移动求职进展汇总
#
1878次浏览
20人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务