【北斗】大模型算法工程师【校招/实习】

薪资面议
人工智能
北京
硕士
2026届
岗位关键词

毕业要求:2026届

投递时间:2025年6月3日-2025年9月3日(即将截止)

岗位职责
研究方向一:大模型智能体Agent技术研究​ ​1.研究多轮长对话中的上下文管理技术,提高模型的连贯性和一致性,并探索基于用户特征和历史交互的定制对话策略,设计针对特定业务场景的微调和适应技术,提升模型在实际应用中的表现。​ 2.探索智能体调用和使用多个外部工具的方法,通过端到端后训练的方式增强其解决实际问题的能力。深度研究智能体的自我评估和学习机制,实现智能体的持续优化和能力提升。​ 3.优化LLM长链路的多轮工具调用能力,提升工具调用时的精确性及用户的实际交互体验。​ 4.设计并完善针对特定任务场景的Auto-Eval能力,指导模型迭代方向。 研究方向二:深度搜索(Deep Search/Research)技术研究​ 1.研究面向深度搜索场景的工具学习方法,基于SFT/RLHF后训练算法赋予搜索智能体高效的工具调用能力。​ 2.对齐行业最前沿的研究进展,深入研究不同工具调用环境下的大模型后训练能力边界,并基于实际业务场景进行迭代优化。​ ​研究方向三:多模态基础模型能力建设​ 1.研究多模态数据(文本、语音、图像等)的语义融合与表示方法,提升模型对复杂内容的理解能力。 2.探索多模态模型在推理任务中的表现,研究如何通过工具调用增强模型的推理能力。​ 3.设计高效的多模态模型架构,优化模型的参数规模、训练效率和推理性能,提升基础模型的通用性与适应性。 ​研究方向四:大模型分布式后训练及推理加速技术​ 1.后训练方向:样本IO吞吐优化:使用多线程读取、数据管道流水线编排、数据压缩等技术,实现分布式环境下高性能的样本IO pipeline;​计算图编译与高效执行:通过图编译、Kernel优化、算子融合等手段,提升计算图的执行效率;高性能并行训练:包括DP/TP/PP/SP/CP/EP等并行策略及其他训练超参数的自动寻优,故障自动恢复,弹性计算等;强化学习训练效率优化:通过rollout速度优化、多模型多阶段流水线编排、负载均衡等手段优化RL训练效率。 2.推理加速方向:负责实现和优化大模型在线推理系统,提升推理性能,包括不限于:架构设计、算子开发、通信优化等; 研究并实现各种模型推理加速手段如并行策略、混合精度、MOE、FP8等技术,加速模型推理速度; 设计和开发高效的离线、在线推理系统,优化SGLang、vLLM等推理框架,加速整体推理性能。 ​研究方向五:基于时空场景感知的用户全域意图理解​ 1. 时空动态感知与即时需求捕捉,用户意图受地理位置(如商圈变化)、时间(如节假日/天气)、实时场景(如突发疫情)等多维度动态因素影响。​ 2. 多模态行为语义对齐与意图蒸馏,用户行为存在显性交互(点击/收藏)与隐性表达(页面停留/滑动速度)的多模态断层,且跨业务场景(到店/到家)行为模式差异显著。 ​3. 隐私安全的多场景知识融合,到店、到家等业务场景数据隔离导致用户认知碎片化,且需符合数据安全合规要求。​​ 研究方向六:多模态供给理解与动态表征建模 ​ ​1. 异构供给的统一语义建模,异构供给(商家/商品/服务/内容)的多模态信息融合难题,需解决文本、图像、视频等跨模态语义对齐与联合表征。​ 2. 实时供给状态感知与动态更新机制,如库存/价格/服务能力等高频变化要素的即时捕捉。 ​3. 领域知识增强的供给深度理解,构建覆盖本地生活全场景的细粒度知识图谱。 ​​研究方向七:端到端生成式搜索系统的构建与优化​ ​1. 端到端生成搜索架构构建,解决传统搜索系统"召回→粗排→精排→重排"多阶段解耦带来的信息损失问题,建立统一生成框架下的多目标联合优化机制;设计新型生成式排序范式,融合Scaling Law原理实现语义空间与行为空间的联合表征。​ 2. 生成结果的可控性与可解释性,构建多粒度约束解码机制,将业务规则、供给状态、合规要求等硬约束编码到生成过程中;同时设计基于强化学习的偏好对齐框架,实现生成质量的双重控制。 ​3. 实时推理性能优化,攻克大模型长序列处理的性能瓶颈,研发基于Attention稀疏化和状态复用的流式生成技术;设计轻量化验证网络,在保证生成质量的前提下将推理延迟降低至毫秒级,支撑亿级DAU场景。 等等,更多方向可投递后详情咨询
岗位要求
1.硕士及以上学历,博士优先,计算机、数学或统计学等相关专业。 2.在Query理解,召回,相关性,排序,智能交互等方面有深入实践,具备大模型相关经验者优先。 3.扎实的深度学习理论基础,精通主流深度学习框架(如Tensorflow、Pytorch),拥有大模型SFT、RAG、DPO/PPO等大模型实操经验优先。 4.具备较强的coding能力,熟练使用Python/C++等语言,在ACL/EMNLP/ICML/CILR/NIPS/CVPR/ICCV等顶会有论文发表经历优先 5.优秀的分析、解决问题能力,对AGI的未来趋势与挑战有浓厚兴趣。 6.精通至少一种深度学习框架(如TensorFlow, PyTorch),并具备良好的编程能力(Python, Java等)。 7.对解决挑战性问题充满激情,较强的责任心、主动性和韧性,能良好的沟通协作。 岗位亮点: 1.拥有业界一流的团队,成员大多来自国内外名校,团队内有多位北斗、博士,可全方位支持前沿技术研究; 2.核心业务支撑,参与前沿的大型模型技术研究和落地,探索大模型技术在实际业务场景中的应用; 3.当前美团核心的GPU落地场景之一,和团队一起探索学习异构计算领域的前沿技术,个人成长快 4.创新型团队扁平化管理,研究成果直接连接数亿用户的实际生活,国内最好的大模型后训练应用土壤。 什么是北斗? 2017年,启动北斗计划的招聘,共引入百余位顶尖科技人才。 2023年,完成自研大模型备案,目前已应用于多个业务场景。 2024年,我们年研发投入219亿。 我们能给北斗: 丰富的场景、海量的数据: 深入大语言模型技术与应用、系统与架构、多模态等美团核心项目,接触真实产业场景和海量数据。 近8亿用户,亿级的日订单量,为技术提升提供充足的数据资源。 AI领域领先的算力、人均算力资源: 数万卡的资源,足以面对近期挑战;不赛马,人均算力资源行业领先。 行业领先的技术团队: 行业大咖、顶会作者,坚持招了8年的百余名北斗。 极具竞争力的薪酬: 别家给得起的,我们都给得起!
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
美团
互联网
已上市
北京,上海,深圳,厦门,成都
查看其他 18 个职位