算法工程师-大语言模型(代码研发 & 端侧模型)(T-Star Lab )-阿里巴巴2027届实习生
薪资面议
人工智能 杭州 本科

投递时间:2026年4月24日-2027年4月24日
岗位职责
1、研发垂域大模型:面向淘宝复杂工程技术体系,构建懂淘宝上下文的研发垂域大模型
·设计面向复杂工程系统的大模型数据构建和训练策略,涵盖离线的研发数据的高质量组织与清洗、在线人机协同的用户轨迹数据组织与迭代、算法训练方式策略选择(CPT、SFT、RL/RLHF)等;
·攻克研发场景的大模型面临的工程系统关系理解、研发领域知识显式记忆与推理、研发域差异化任务规划及工具调用、及情景感知检索等方向难题,打造懂业务、懂架构的研发智能体能力。
2、端侧大模型探索:结合淘宝开源端侧深度推理引擎 MNN,探索极致高效的端侧大模型技术
·摒弃单纯的模型压缩思路,以端侧NPU/CPU/GPU 的硬件特性牵引大模型架构设计,探索并设计适合端侧运行的高效模型架构,在有限算力下突破性能瓶颈;
·负责端侧模型的全流程训练探索,涉及从预训练及后训练优化,结合投机采样、KV Cache优化、混合量化等优化,得到高性能的端侧大模型。
岗位要求
1. 计算机科学、人工智能、机器学习或相关领域专业、研究方向,毕业时间在26年11月以后的硕博在校生;
2. 在自然语言、LLM大模型、多模态大模型、大模型轻量化等相关领域的研究研发经验;
3. 具备出色的编程能力,熟练掌握Pytorch等深度学习框架和Python编程语言;
4. 敢于突破现状,勇于探索新思路、新技术,能够积极主动地进行协助沟通,配合团队共同完成目标。
【加分项】
在相关领域会议(如NeuIPS、ICML、ICLR、CVPR、ACL、AAAI、Interspeech、EMNLP、ICASSP等)发表过一作文章,有ACM竞赛获奖者优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报