Hayden_CY level
获赞
42
粉丝
17
关注
7
看过 TA
604
四平职业大学
2026
机器学习
IP属地:湖南
藏器于身,待时而动
私信
关注
10-26 02:36
已编辑
四平职业大学 机器学习
介绍一下几个感兴趣的组我了解到情况:(1)蚂蚁集团:Base杭州,暑期实习的组,组里氛围很好,方向做的是:大模型推理优化+编译,但是岗位在开发序列,今年由于接了新业务,工作时长有所增加(早10晚9),之前是比较轻松(早10晚7),组里主管对我很重视,入职有机会独立负责较好的项目,并且主管的技术视野很好,有很好的技术嗅觉;(2)字节跳动:Base上海,Data推荐架构大组,小组是做国内平台垂类推荐系统的(头条、红果、西瓜等),不是主端(抖音),不过主端也是同一个大组,未来可能有机会内部活水,听面试官说的工作强度还可以,早10晚9,但是听网友说今年大组整体的变动比较大,但是心里对字节有所期待,毕竟是宇宙厂;(3)美团:Base上海,大模型基座做LoongCat的推理/算子的组,是从北斗计划流转到正式批的,没有再次面试,是一面面试官和我聊的比较好,直接从北斗那边捞回来的,LoongCat是团子目前最出名的模型吧,所以组也算比较核心;三个我都有觉得好的点,其他还有一些了解不多的offer,也请大家一块帮忙选一下,我个人觉得业务是否核心比较重要,对未来职业的发展会比较好,求各位大佬给出意见,并请各位大佬给出对应选择的理由还有小红书和腾讯还在面试流程中,不知道面过的概率大不大
我的求职进度条
0 点赞 评论 收藏
分享
09-23 21:27
已编辑
四平职业大学 机器学习
面试有史以来第一次是本校学长/学姐面,但是很可惜可能G了首先自我介绍,介绍两段实习+硕士课题,先简单介绍了一下,然后让我重点详细介绍一下在蚂蚁的实习工作,就按照timeline列举了一下做了哪些工作,中间穿插一些提问然后又让我重点介绍了自己的硕士课题,聊完课题之后提问:问:是否了解内存池,如果让你设计一个动态内存池,你会有哪些考量?答:先说明自己没有做过上层的内存管理,然后从底层的内存管理介绍了一下,对数据分块、淘汰策略、数据预取等方面的一些基础的策略,然后面试官也没有追问拷打(感谢心软学姐);问:对未来的职业方向有没有自己的想法?答:说了一下自己硕士的方向与现在大模型优化技术的结合,未来可能是一个潜在的优化点,举了一个详细的例子;手撕:实现一个包含环检测功能的链表反转的代码,如果有环,返回nullptr,如果无环返回反转后的head node,腾讯手撕依旧考察基础,让我写完整并且打印示例,一次通过了反问:了解一下业务?答:主要做大数据,介绍了一些业务场景,然后心凉半截,因为我说的未来规划和业务场景基本上毫无关系然后又提问是否了解Ray?我没有听过,我说不了解,然后又问了一句,对其他分布式工具是否有所了解,然后就说了Megtron了解一些后续下来问室友发现Ray就是vLLM官方实现分布式的一个工具,但是之前也没有了解过
发面经攒人品
0 点赞 评论 收藏
分享
一开始投递的不是这个岗位,但是这个是被Boss上的一个HR/招生组的人捞到了这个组,也是做Infra的组,但是没想到岗位居然是后端开发。京东的面试也是比较曲折,因为自己的电脑是Linux单系统,本来是周二面试,结果面试前10分钟才发现面试需要装软件,还没有提供Linux版本的deb包,所以没法用电脑面试,然后拨打了邮件里的固定电话,和HR说明了情况调整到周三的同一时间了,而且第一次发邀约的时候,发来的几个时间都不合适,也找HR调整了时间,希望不会觉得我是一个不靠谱的人,邮件里写的面试时间是30分钟,但是实际上面试+手撕的总时间大概有70分钟,这场手撕的很慢也有原因也是先简单过了简历,在我简单介绍完简历之后,先评价我说过往以及在校的项目传统软件的这个方向偏多,对于LLM Infra经验可能没有那么多,然后就是对项目中的Infra经历进行了一些询问,然后在聊了之后问我,之前有没有N卡的技术栈(因为Infra经历是在非N卡平台上做的),我说之前上课有契机写过几个CUDA Kernel的大作业,然后后续根据个人兴趣的情况,也简单学习了Triton算子的编写(为后续的离谱手撕埋下了伏笔)然后又聊了聊,除了实习经历中使用的推理框架,有没有了解过其他的推理框架,我说对SGLang也有所了解,SGLang的优势我觉得在KVCache的管理方面,它的RadixAttention机制比PageAttention对KV的复用率更高,所以对吞吐的提升可能更高,其他的特性vLLM和SGLang框架基本都会借鉴,两者在特性叠加方面我了解的差别不是很大,面试官也没有深挖,然后就是离谱的手撕了:题目:用Triton编写FlashAttention,和面试官确认了qkv相关的stride都是默认为1,然后确认了一下输入参数,就开始编写,这个手撕写了起码有20分钟+,把kernel函数的加载&运算都写出来了,后面和面试官说后续就是把结果存回内存了,面试官就没有让我继续写了(真的很痛苦,后续看代码,发现有几个接口都用错了),整体逻辑没有很大的问题,大概就是利用分块加载&计算QKV,并且和面试官讲解了softmax防止溢出的策略,就差不多结束了反问环节:base地、组里业务(面试官主动介绍),有三个方向:(1)框架侧推理优化&业务场景适配;(2)算子编译;(3)忘记了,好像是非N卡平台的推理?然后面试官就问我的意向,对他们组是不是感兴趣,我说感觉还是蛮适合的,比较match的,对组里还是很感兴趣的,然后问了下后续流程的情况,说大概一周左右有反馈,一般需要一周左右的时间进行评估。买东西我只用京东,求东子哥发个offer吧
查看6道真题和解析
0 点赞 评论 收藏
分享
经典过简历项目,重点问了最近这段的实习经历的主要工作,并且面试官的提问全程都非常落地,投递的Infra岗位,提问感觉像是在拷打算法,罗列几个回答的不太好的问题:1、你们的场景是如何使用并行策略的?比如TP/DP等答:采用TP2,DP8,EP16的单机16卡的并行策略2、接着问:TP和DP应用在哪个权重计算的位置,并且两者是如何进行协同的?答:TP/DP应用在Attention+FFN结构中的Attention,MoE模型的FFN使用EP,如何协同没回答上来,问了很久这个地方,最后和面试官说抱歉了,这部分的工作我没有具体落地做过,所以没有仔细研究过,然后面试官很有耐心的给我讲了一遍这部分的原理,也算是学习了3、问我对推理Infra调度方面的策略有没有了解过,比如动态批处理...等几个调度方面的工作答:简单描述了一下动态批处理的机制,主动说没有做过这方面的落地4、还问了对于推理框架的KVCache管理策略有没有了解过?答:介绍了一下vLLM社区的PageAttention,但是介绍的也非常粗糙,说类似于传统OS中的页表管理,并且言多必失,我说这个Page大小需要被精心设计,不能过大也不能过小,然后被拷问了为什么不能过大以及为什么不能过小的原因,感觉回答的也不是很好,被用例子拷打了接下来就是手撕阶段了,手撕也比较抽象,手撕的是MoE层的Dispatch过程,我用C++写的:输入是token的gating_scores和k,要求返回k个专家分配到的对应的token_id这个写的比较艰难吧,写的速度比较慢,最后时间不太够了,面试官看了我前面的实现代码和我说:思路我看了一下基本上是正确的,时间不够了也没叫我接着讲思路,就说那我们今天就到这里吧PS:面试过程感觉面试官非常有耐心,真的非常专业,实打实的一线开发人员,并且也乐于分享,回答不上来或者回答错误的问题面试官都耐心的给我讲解了,感觉自己发挥的不是很好,感觉虽然过的概率不大,但还是希望智谱能给个机会
查看5道真题和解析
0 点赞 评论 收藏
分享

创作者周榜

更多
关注他的用户也关注了:
牛客网
牛客网在线编程
牛客网题解
牛客企业服务