阿里巴巴26届算法工程师工程师-RL

1000-1010元/天
算法工程师
杭州
硕士
5天/周
最少3个月
有转正
岗位关键词
岗位职责
关于我们 ● 我们是阿里国际数字商业集团-跨境贸易事业部 (ICBU)-Accio算法团队 ● Accio产品是聚焦于全网B类信息和商品的搜索平台,技术上致力于研发基于LLM的agent系统和基于RL的推理模型的构建和应用,团队技术氛围浓厚,论文多次被ICLR、KDD、SIGIR、AAAI、WWW等会议录用 职位描述 1. 基于RL技术,研究reasoning模型相关技术,实现电商场景数据训练专属推理模型 2. 基于RL技术,研究cot+coa融合的端到端agent模型,实现原生可工具调用和多步思考的推理模型 3. 探索电商版本deep research,实现新一代复杂agent task的产品能力
岗位要求
1. 计算机、电子、数学物理等相关专业在读硕士或以上学历,具有RL基础以及RL在LLM应用的经验 2. 极佳的工程实现能力,熟练运用Python/Pytorch/SQL,有LLM相关项目的上手经验 3. 有强烈求知欲,对人工智能领域相关技术有热情,有强烈的责任心和团队合作精神 4. 加分项:有RL/LLM相关的顶会paper/开源项目,在相关团队有过实习经历
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报