算法工程师-大模型后训练 (Post-training)-阿里巴巴2027届实习生

薪资面议
人工智能
上海/杭州/北京
本科

投递时间:2026年4月24日-2027年4月24日

岗位职责
1. 探索更多可Scalable的Verifier信号,并通过RL提升模型的各项能力; 2. 提升reward model在创作、人类偏好、指令遵循等各专项上的能力,减少reward hacking和bias; 3. 研究reasoning path压缩和外推,实现更高质量的推理思考; 4. 将LLM的推理能力和 agent以及其他模态相结合,探索统一模态的reasoning。
岗位要求
1. 本科及以上学历,人工智能、机器学习、深度学习、软件工程、相关专业优先; 2. 在深度学习、大规模模型训练、优化算法、生成式模型、自监督学习等领域有扎实的理论基础和实践经验,并至少在其中一个方向有学术成果或项目经历; 3. 具有较强的代码工程能力,精通 Python 以及 Pytorch 等深度学习框架,熟悉LLM推理引擎(如vLLM,SGLang)的实现; 4. 对基础模型的前沿问题有持续热情,具备独立思考能力和系统性研究思维,敢于挑战现有范式;能够独立应用技术解决复杂问题,主导或深度参与过有影响力项目的人选优先; 5. 具备跨学科视野与协作意识,能够与工程、产品等多学科团队紧密合作,推动研究成果快速落地并产生实际影响力。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 499 个职位