美团北斗大模型算法工程师内推链接和内推码

【北斗】大模型算法工程师(多模态/后训练/DeepSearch/RL)
内推链接:http://dpurl.cn/75M1Wd9z
内推码:HY5Y8BR(该内推码多岗位可用)

岗位职责
研究方向一:大模型智能体Agent技术研究​
​1.研究多轮长对话中的上下文管理技术,提高模型的连贯性和一致性,并探索基于用户特征和历史交互的定制对话策略,设计针对特定业务场景的微调和适应技术,提升模型在实际应用中的表现。​
2.探索智能体调用和使用多个外部工具的方法,通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制,实现智能体的持续优化和能力提升。​
3.优化LLM长链路的多轮工具调用能力,提升工具调用时的精确性及用户的实际交互体验。​
4.设计并完善针对特定任务场景的Auto-Eval能力,指导模型迭代方向。

研究方向二:深度搜索(Deep Search/Research)技术研究​
1.研究面向深度搜索场景的工具学习方法,基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。​
2.对齐行业最前沿的研究进展,深入研究不同工具调用环境下的大模型后训练能力边界,并基于实际业务场景进行迭代优化。​

​研究方向三:多模态基础模型能力建设​
1.研究多模态数据(文本、语音、图像等)的语义融合与表示方法,提升模型对复杂内容的理解能力。
2.探索多模态模型在推理任务中的表现,研究如何通过工具调用增强模型的推理能力。​
3.设计高效的多模态模型架构,优化模型的参数规模、训练效率和推理性能,提升基础模型的通用性与适应性。

​研究方向四:大模型分布式后训练及推理加速技术​
1.后训练方向:样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;​计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等;强化学习训练效率优化:通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。
2.推理加速方向:负责实现和优化大模型在线推理系统,提升推理性能,包括不限于:架构设计、算子开发、通信优化等; 研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术,加速模型推理速度; 设计和开发高效的离线、在线推理系统,优化SGLang、vLLM等推理框架,加速整体推理性能。

任职要求
1.硕士及以上学历,博士优先,计算机、数学或统计学等相关专业。
2.在Query理解,召回,相关性,排序,智能交互等方面有深入实践,具备大模型相关经验者优先。
3.扎实的深度学习理论基础,精通主流深度学习框架(如Tensorflow、Pytorch),拥有大模型SFT、RAG、DPO/PPO等大模型实操经验优先。
4.具备较强的coding能力,熟练使用Python/C++等语言,在ACL/EMNLP/ICML/CILR/NIPS/CVPR/ICCV等顶会有论文发表经历优先
5.优秀的分析、解决问题能力,对AGI的未来趋势与挑战有浓厚兴趣。
6.精通至少一种深度学习框架(如TensorFlow, PyTorch),并具备良好的编程能力(Python, Java等)。
7.对解决挑战性问题充满激情,较强的责任心、主动性和韧性,能良好的沟通协作。

岗位亮点:
1.拥有业界一流的团队,成员大多来自国内外名校,团队内有多位北斗、博士,可全方位支持前沿技术研究;
2.核心业务支撑,参与前沿的大型模型技术研究和落地,探索大模型技术在实际业务场景中的应用;
3.当前美团核心的GPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快
4.创新型团队扁平化管理,研究成果直接连接数亿用户的实际生活,国内最好的大模型后训练应用土壤。

工作城市
北京市

#牛客AI配图神器# #美团内推# #美团内推码#
全部评论

相关推荐

真实工作体验~先说结论:非常安利!!! 在滴滴成长很快,对新人有培养体系。老板们和同事都很职业,能力强,培养了我比较好的职业习惯,也拿到了比较好的结果。当然有时候压力也会大一点点,挺过去就好了。 上下班不打卡,包晚餐,9点后打车免费。有商保报销90%,过节有公司礼盒。有人情味,相较其他厂老人(3年以上司龄)相对更多些!⭐关于职场氛围:真的很爱滴滴🍊的氛围,大家都很亲近,组里人也会一起吃饭,而且经常被请客,嘻嘻。还有就是可能职场不是很大,整个二楼一半人我都认识了!我从最开始比较害羞到慢慢主动和别人搭话噜,感觉这次实习认识的小伙伴还是比较多的! ⭐关于成长:mt和同事不管在日常工作上还是求职、职业规划上都给我提供了帮助,花时间辅导我面试、回答我幼稚的问题…这些都让我很感激!而且我也看到了他们的工作状态,对商分、数分有了一些理解。有时候和他们的交流给迷茫时期的我带来了一些慰藉。不过有时候组里忙起来可能就没人管我,所以我也狠狠摸鱼了 ⭐通勤不太方便是真的,上海职场离地铁站老远了,而且地理位置离上海哪个高校都远;晚上的饭菜也不是很好吃;茶水间只有开水…… 但是工位不挤,实习生独立工位这点还是蛮好嘟;而且楼下有健身房,有时间可以去跑个步哦~ ⭐很爱Mac book前置拍出来糊糊的感觉!宝子们可以试一下hhh,摸鱼不干别的就是自拍、养花、吃零食滴滴2026届秋招储备实习生招聘正式启动啦!🚘岗位类别工程/算法/数据/安全技术/效能管理/产品/商业分析/金融模型/运营/专业职能/其他🚘投递要求2025年9月~2026年8月之间毕业的海内外高校毕业生,每人可投递1个岗位🚘工作地点北京/杭州/上海等🚘招聘流程简历投递(4.15起)-面试安排-Offer发放🚘【内推链接】https://app.mokahr.com/campus-recruitment/didiglobal/96064?recommendCode=DScKP9qC#/jobs【内推码】DScKP9qC立刻投递,快人一步,抢跑未来立刻投递,快人一步,抢跑未来!大家投递完可以在评论区打上姓名缩写+岗位(比如PM+LJJ),我来确认有没有内推成功喽                                                                                                                                                                                                                                                                                  
点赞 评论 收藏
分享
员工内推,官网投递,输入内推码(p1)秋招hc充足,内推经验丰富,欢迎投递和交流今年秋招启动早,早投早筛选!实习的时候很多同学投太晚了,投的时候已经没有hc了内容简单分节,大家挑自己感兴趣的部分看即可关于工作环境:南京这边工作环境真的非常好,工位面积有我学校两个大,椅子是人体工学椅。楼层都会有饮水机、冰箱、微波炉,卫生间非常干净,环境令人感到幸福。有免费的健身房,常用器械都有,也有操房淋浴间和乒乓球台关于福利活动:自选夜宵种类丰富,上班之后就没有买过牛奶酸奶水果了,之前上学时候自己不舍得买的荔枝樱桃蓝莓也是吃了个爽~每个月部门都会有免费零食和下午茶,节日期间还会展开活动,氛围很好关于内推:①内推只区分有和没有,所有内推等效,找个你看着顺眼的、好交流的人投就行②⚠️内推【不能】免初筛进入笔试!有些人为了拉人投自己的内推,连“包进笔试”这种话都说得出来,这种人你后面问他别的他也不会说实话的③内推不能帮忙查进度&推流程!内推者和求职者看到的流程是相同的,不存在求职者看不到进度的说法,官网都能看!HR那边的时间安排也不会通知到我们员工,所以类似问题是帮不上忙的④不同地区的情况不同,我只对南京地区有粗浅了解,其他地区和岗位的问题无法解答常见问题QA,见p2-p5建议大家不要对某家公司抱太高期待,投完就不去想了,有推进就准备,没推进继续准备别家,多投机会多 欢迎评论or私信提问!鼓励评论,这样共性问题可以被其他同学看到(还能给我点热度)祝各位同学好运,期待在公司见到大家😊
荣耀
|
校招
|
超多精选岗位
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务