【北斗】大模型算法工程师【校招/实习】

薪资面议

人工智能

硕士

2026届

蒋先生

北京三快在线科技有限公司·后端开发工程师

反馈率：100% | 反馈时长：4天

岗位关键词

毕业要求：2026届

投递时间：2025年6月3日-2025年9月3日（即将截止）

岗位职责

研究方向一：大模型智能体Agent技术研究 1.研究多轮长对话中的上下文管理技术，提高模型的连贯性和一致性，并探索基于用户特征和历史交互的定制对话策略，设计针对特定业务场景的微调和适应技术，提升模型在实际应用中的表现。 2.探索智能体调用和使用多个外部工具的方法，通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制，实现智能体的持续优化和能力提升。 3.优化LLM长链路的多轮工具调用能力，提升工具调用时的精确性及用户的实际交互体验。 4.设计并完善针对特定任务场景的Auto-Eval能力，指导模型迭代方向。研究方向二：深度搜索（Deep Search/Research）技术研究 1.研究面向深度搜索场景的工具学习方法，基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。 2.对齐行业最前沿的研究进展，深入研究不同工具调用环境下的大模型后训练能力边界，并基于实际业务场景进行迭代优化。研究方向三：多模态基础模型能力建设 1.研究多模态数据（文本、语音、图像等）的语义融合与表示方法，提升模型对复杂内容的理解能力。 2.探索多模态模型在推理任务中的表现，研究如何通过工具调用增强模型的推理能力。 3.设计高效的多模态模型架构，优化模型的参数规模、训练效率和推理性能，提升基础模型的通用性与适应性。研究方向四：大模型分布式后训练及推理加速技术 1.后训练方向：样本IO吞吐优化：使用多线程读取、数据管道流水线编排、数据压缩等技术，实现分布式环境下高性能的样本IO pipeline；计算图编译与高效执行：通过图编译、Kernel优化、算子融合等手段，提升计算图的执行效率；高性能并行训练：包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优，故障自动恢复，弹性计算等；强化学习训练效率优化：通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。 2.推理加速方向：负责实现和优化大模型在线推理系统，提升推理性能，包括不限于：架构设计、算子开发、通信优化等；研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术，加速模型推理速度；设计和开发高效的离线、在线推理系统，优化SGLang、vLLM等推理框架，加速整体推理性能。研究方向五：基于时空场景感知的用户全域意图理解 1. 时空动态感知与即时需求捕捉，用户意图受地理位置（如商圈变化）、时间（如节假日/天气）、实时场景（如突发疫情）等多维度动态因素影响。 2. 多模态行为语义对齐与意图蒸馏，用户行为存在显性交互（点击/收藏）与隐性表达（页面停留/滑动速度）的多模态断层，且跨业务场景（到店/到家）行为模式差异显著。 3. 隐私安全的多场景知识融合，到店、到家等业务场景数据隔离导致用户认知碎片化，且需符合数据安全合规要求。研究方向六：多模态供给理解与动态表征建模 1. 异构供给的统一语义建模，异构供给（商家/商品/服务/内容）的多模态信息融合难题，需解决文本、图像、视频等跨模态语义对齐与联合表征。 2. 实时供给状态感知与动态更新机制，如库存/价格/服务能力等高频变化要素的即时捕捉。 3. 领域知识增强的供给深度理解，构建覆盖本地生活全场景的细粒度知识图谱。研究方向七：端到端生成式搜索系统的构建与优化 1. 端到端生成搜索架构构建，解决传统搜索系统"召回→粗排→精排→重排"多阶段解耦带来的信息损失问题，建立统一生成框架下的多目标联合优化机制；设计新型生成式排序范式，融合Scaling Law原理实现语义空间与行为空间的联合表征。 2. 生成结果的可控性与可解释性，构建多粒度约束解码机制，将业务规则、供给状态、合规要求等硬约束编码到生成过程中；同时设计基于强化学习的偏好对齐框架，实现生成质量的双重控制。 3. 实时推理性能优化，攻克大模型长序列处理的性能瓶颈，研发基于Attention稀疏化和状态复用的流式生成技术；设计轻量化验证网络，在保证生成质量的前提下将推理延迟降低至毫秒级，支撑亿级DAU场景。等等，更多方向可投递后详情咨询

岗位要求

1.硕士及以上学历，博士优先，计算机、数学或统计学等相关专业。 2.在Query理解，召回，相关性，排序，智能交互等方面有深入实践，具备大模型相关经验者优先。 3.扎实的深度学习理论基础，精通主流深度学习框架(如Tensorflow、Pytorch)，拥有大模型SFT、RAG、DPO/PPO等大模型实操经验优先。 4.具备较强的coding能力，熟练使用Python/C++等语言，在ACL/EMNLP/ICML/CILR/NIPS/CVPR/ICCV等顶会有论文发表经历优先 5.优秀的分析、解决问题能力，对AGI的未来趋势与挑战有浓厚兴趣。 6.精通至少一种深度学习框架（如TensorFlow, PyTorch），并具备良好的编程能力（Python, Java等）。 7.对解决挑战性问题充满激情，较强的责任心、主动性和韧性，能良好的沟通协作。岗位亮点： 1.拥有业界一流的团队，成员大多来自国内外名校，团队内有多位北斗、博士，可全方位支持前沿技术研究； 2.核心业务支撑，参与前沿的大型模型技术研究和落地，探索大模型技术在实际业务场景中的应用； 3.当前美团核心的GPU落地场景之一，和团队一起探索学习异构计算领域的前沿技术，个人成长快 4.创新型团队扁平化管理，研究成果直接连接数亿用户的实际生活，国内最好的大模型后训练应用土壤。什么是北斗？ 2017年，启动北斗计划的招聘，共引入百余位顶尖科技人才。 2023年，完成自研大模型备案，目前已应用于多个业务场景。 2024年，我们年研发投入219亿。我们能给北斗：丰富的场景、海量的数据：深入大语言模型技术与应用、系统与架构、多模态等美团核心项目，接触真实产业场景和海量数据。近8亿用户，亿级的日订单量，为技术提升提供充足的数据资源。 AI领域领先的算力、人均算力资源：数万卡的资源，足以面对近期挑战；不赛马，人均算力资源行业领先。行业领先的技术团队：行业大咖、顶会作者，坚持招了8年的百余名北斗。极具竞争力的薪酬：别家给得起的，我们都给得起！

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

美团

互联网

已上市

北京，上海，深圳，厦门，成都

查看其他 18 个职位

107 笔试题目 4976 面试经验 571 面试短评