小米 大模型算法实习 二面面经

全程50分钟,被拷打得半死的一集😭

1.自我介绍

2.拷打第一个项目,这面试官确实很懂技术,疯狂拷打,我的是一个RAG的项目,我讲到构建向量数据库的时候问我用的embedding模型的结构是什么,输出向量的维度,用的切分段落的模型的结构,然后我讲到lora微调又让我将lora的细节,讲lora训练过程中transformer更新哪些参数;然后让我讲chatglm123怎么变化的;最后让我讲缓解幻觉的方式,总之鼠鼠被问的戴上了痛苦面具😭

3.拷打第二个项目,我的是一个论文的项目,然后我共享桌面讲论文,这将成为今天最轻松的时刻

4.问我问题,问了我transformer结构,我开始吟唱,结果刚吟唱就被打断,问我输入的向量纬度,然后我吟唱到多头注意力的时候问我为什么要除以根号dk,然后说到layer norm的时候问我对哪个纬度做归一化,直接被拷打麻了😭

5.代码题,反转链表,由于个人习惯我用了一种把节点存在list里的方法,做完又让我讲不用list的方法

这次拷打让我极其难崩😭看来基础知识还是学的不够细

———————————————————

问了认识的主管,说下周给我发offer

米孝子,启动!

———————————————————-

发了offer,签了

顺便问下路过的佬有没有去武汉小米实习的,可以交流一下,组个饭搭子什么的

#算法#  #面试时最害怕被问到的问题#  #面试中的破防瞬间#  #简历被挂麻了,求建议#  #软件开发2024笔面经#

全部评论
代码反转这个题,有寓意。(回去吧)😤
11
送花
回复 分享
发布于 04-11 22:19 四川
RAG那个我不会,其他的都是llm基本八股吧,不过我前两天面小米也被拷打,甚至让我现场读论文
4
送花
回复 分享
发布于 04-11 21:38 北京
国泰君安
校招火热招聘中
官网直投
我也是小米武汉算法二面,请问算法题是口述的吗
2
送花
回复 分享
发布于 04-18 16:00 上海
对实习生来说确实有点难度哈哈哈,不过也别灰心,也可能能过的
1
送花
回复 分享
发布于 04-12 11:21 广东
哥,那个RAG的分块你是用啥方法做的
1
送花
回复 分享
发布于 04-12 11:50 辽宁
我的米,一直在简历评估
1
送花
回复 分享
发布于 04-22 23:36 北京
我记得当时没看到小米有大模型算法实习啊,这个岗位叫什么啊,自然语言处理工程师吗?
1
送花
回复 分享
发布于 04-29 13:08 韩国
大哥太牛了,这么多约面已经遥遥领先了✌
点赞
送花
回复 分享
发布于 04-12 20:12 广东
佬,想问一下现在还有实习的hc吗,刚约面了
点赞
送花
回复 分享
发布于 05-23 10:51 安徽

相关推荐

好久没面了,生疏的一批😭全程一个小时1.自我介绍2.拷打第一个项目,我的是一个rag的项目,先让我大概介绍一下,然后问我对比解码缓解幻觉具体怎么做的,我开始吟唱;然后开始问八股,先问llama跟transformer相比有什么结构优化,我就说了几点重要的;然后问我lora微调和全参微调的区别,我开始吟唱,然后问我为什么不用全参,我说显存什么的,又问了显存占用的对比;接着问我rag有什么缺点,我就说召回不准难处理、文档分块容易破坏语义什么的3.拷打第二个项目,我的是一个论文项目,直接共享论文开始吟唱;吟唱了好久然后开始提问,问我对话生成基座用的什么,我说没用大模型;然后问我为什么用chatgpt作为情绪原因推理的模型而不用小模型微调的方法,我说它能更好的处理常识知识关系,推理的更准确;然后问我大模型为什么比小模型有更强的能力,我就说了我的理解4.代码题,我用的网页版如流,他说网页版考不了代码,让我现场下载客户端,我在公司用手机开热点面的,下载了半天,尬的一批代码题是个乘积最大的连续子数组,应该是比较简单的,我记得我刷过,但是我已经有两个月没刷题了,全忘完了,本来准备今天复习一天,结果mentor直接给我上强度,服了;总之是暴力写的,寄的死死的😭5.反问,问什么业务,说是做千帆平台以及一些tob和toc的业务好久没面试了,有一个月了都,鼠鼠东西基本都忘完了😭这次是在目前实习的公司面的,本来想升级一下项目再面,结果一直没找到时间,简历上漏洞百出的还没改,难崩;然后我发现面试也遵循木桶效应,而我的短板是算法题,看来得认真开始刷了 #软件开发2024笔面经#  #我的失利项目复盘#  #面试中的破防瞬间#  #面试时最害怕被问到的问题#  #算法#  #简历被挂麻了,求建议#   #如何判断面试是否凉了#
点赞 评论 收藏
分享
约的是周六上午的面试,面试官在家主要是围绕项目里进行提问,问得比较温和- 缓存穿透背景- 布隆过滤器的它的原理是什么- 除了布隆过滤器,还有没有其他的方法去避免缓存穿透?- 缓存数据库一致性有哪些解决方式?- 缓存双删它的过程是怎样的,你可以先说一下过程,然后去分析。(这段有点没捋明白,说的有点磕巴)- 还有其他的吗?(先写数据库再删除缓存、binlog+mq)- 你刚才提到了就是说依据是先写数据库再删缓存这种,它的弊端是高并发的场景下不太适用是吗?是的,它我觉得是有一些风险。- 高并发的场景应该用哪种的策略。我觉得用binlog配合mq会比较好。- 令牌限流的原理是怎么样的?- 限流措施还有别的模型吗?- 令牌桶和漏桶的区别?(漏桶不记得了)- 说一下mvcc的实现原理,还有是它解决了啥问题了?- 它能不能解决幻读问题。- 什么情况下没解决幻读问题(这块有点卡住)- 什么是高内聚低耦合?- 有什么设计模式可以保证高内聚低耦合?- 有什么其他的有什么原则吗?就是设计模式的原则。- 问之前实习经历(非互联网)- 做题 寻找和为k的子数组个数- 反问 大team业务是做多媒体 周末不上班除了mvcc问的基本都是简历里项目相关的,项目是123066.3 二面 希望难度跟一面一样
查看18道真题和解析
点赞 评论 收藏
分享
12 35 评论
分享
牛客网
牛客企业服务