【北斗】大模型算法工程师【校招/实习】
薪资面议
人工智能 北京 硕士 2026届

岗位关键词
毕业要求:2026届
投递时间:2025年6月3日-2025年9月3日(即将截止)
岗位职责
研究方向一:大模型智能体Agent技术研究
1.研究多轮长对话中的上下文管理技术,提高模型的连贯性和一致性,并探索基于用户特征和历史交互的定制对话策略,设计针对特定业务场景的微调和适应技术,提升模型在实际应用中的表现。
2.探索智能体调用和使用多个外部工具的方法,通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制,实现智能体的持续优化和能力提升。
3.优化LLM长链路的多轮工具调用能力,提升工具调用时的精确性及用户的实际交互体验。
4.设计并完善针对特定任务场景的Auto-Eval能力,指导模型迭代方向。
研究方向二:深度搜索(Deep Search/Research)技术研究
1.研究面向深度搜索场景的工具学习方法,基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。
2.对齐行业最前沿的研究进展,深入研究不同工具调用环境下的大模型后训练能力边界,并基于实际业务场景进行迭代优化。
研究方向三:多模态基础模型能力建设
1.研究多模态数据(文本、语音、图像等)的语义融合与表示方法,提升模型对复杂内容的理解能力。
2.探索多模态模型在推理任务中的表现,研究如何通过工具调用增强模型的推理能力。
3.设计高效的多模态模型架构,优化模型的参数规模、训练效率和推理性能,提升基础模型的通用性与适应性。
研究方向四:大模型分布式后训练及推理加速技术
1.后训练方向:样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等;强化学习训练效率优化:通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。
2.推理加速方向:负责实现和优化大模型在线推理系统,提升推理性能,包括不限于:架构设计、算子开发、通信优化等; 研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术,加速模型推理速度; 设计和开发高效的离线、在线推理系统,优化SGLang、vLLM等推理框架,加速整体推理性能。
研究方向五:基于时空场景感知的用户全域意图理解
1. 时空动态感知与即时需求捕捉,用户意图受地理位置(如商圈变化)、时间(如节假日/天气)、实时场景(如突发疫情)等多维度动态因素影响。
2. 多模态行为语义对齐与意图蒸馏,用户行为存在显性交互(点击/收藏)与隐性表达(页面停留/滑动速度)的多模态断层,且跨业务场景(到店/到家)行为模式差异显著。
3. 隐私安全的多场景知识融合,到店、到家等业务场景数据隔离导致用户认知碎片化,且需符合数据安全合规要求。
研究方向六:多模态供给理解与动态表征建模
1. 异构供给的统一语义建模,异构供给(商家/商品/服务/内容)的多模态信息融合难题,需解决文本、图像、视频等跨模态语义对齐与联合表征。
2. 实时供给状态感知与动态更新机制,如库存/价格/服务能力等高频变化要素的即时捕捉。
3. 领域知识增强的供给深度理解,构建覆盖本地生活全场景的细粒度知识图谱。
研究方向七:端到端生成式搜索系统的构建与优化
1. 端到端生成搜索架构构建,解决传统搜索系统"召回→粗排→精排→重排"多阶段解耦带来的信息损失问题,建立统一生成框架下的多目标联合优化机制;设计新型生成式排序范式,融合Scaling Law原理实现语义空间与行为空间的联合表征。
2. 生成结果的可控性与可解释性,构建多粒度约束解码机制,将业务规则、供给状态、合规要求等硬约束编码到生成过程中;同时设计基于强化学习的偏好对齐框架,实现生成质量的双重控制。
3. 实时推理性能优化,攻克大模型长序列处理的性能瓶颈,研发基于Attention稀疏化和状态复用的流式生成技术;设计轻量化验证网络,在保证生成质量的前提下将推理延迟降低至毫秒级,支撑亿级DAU场景。
等等,更多方向可投递后详情咨询
岗位要求
1.硕士及以上学历,博士优先,计算机、数学或统计学等相关专业。
2.在Query理解,召回,相关性,排序,智能交互等方面有深入实践,具备大模型相关经验者优先。
3.扎实的深度学习理论基础,精通主流深度学习框架(如Tensorflow、Pytorch),拥有大模型SFT、RAG、DPO/PPO等大模型实操经验优先。
4.具备较强的coding能力,熟练使用Python/C++等语言,在ACL/EMNLP/ICML/CILR/NIPS/CVPR/ICCV等顶会有论文发表经历优先
5.优秀的分析、解决问题能力,对AGI的未来趋势与挑战有浓厚兴趣。
6.精通至少一种深度学习框架(如TensorFlow, PyTorch),并具备良好的编程能力(Python, Java等)。
7.对解决挑战性问题充满激情,较强的责任心、主动性和韧性,能良好的沟通协作。
岗位亮点:
1.拥有业界一流的团队,成员大多来自国内外名校,团队内有多位北斗、博士,可全方位支持前沿技术研究;
2.核心业务支撑,参与前沿的大型模型技术研究和落地,探索大模型技术在实际业务场景中的应用;
3.当前美团核心的GPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快
4.创新型团队扁平化管理,研究成果直接连接数亿用户的实际生活,国内最好的大模型后训练应用土壤。
什么是北斗?
2017年,启动北斗计划的招聘,共引入百余位顶尖科技人才。
2023年,完成自研大模型备案,目前已应用于多个业务场景。
2024年,我们年研发投入219亿。
我们能给北斗:
丰富的场景、海量的数据:
深入大语言模型技术与应用、系统与架构、多模态等美团核心项目,接触真实产业场景和海量数据。
近8亿用户,亿级的日订单量,为技术提升提供充足的数据资源。
AI领域领先的算力、人均算力资源:
数万卡的资源,足以面对近期挑战;不赛马,人均算力资源行业领先。
行业领先的技术团队:
行业大咖、顶会作者,坚持招了8年的百余名北斗。
极具竞争力的薪酬:
别家给得起的,我们都给得起!
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报