淘天集团-淘宝APP AI助手算法团队-多模态/大模型应用-开始校招实习啦!
【内推码:XK7ECI】
【文末扫码直达部门!避免出现货不对板,避免简历流转到公共池流浪!!】
淘天集团AI助手算法团队承担了淘天集团新一代AI原生购物助手的开发工作,通过统一的All in One大模型解决淘宝在不同场景的用户需求。团队在大模型强化学习、Agentic训练、原生多模态训练以及Agent框架设计有着行业领先的认知和实际落地效果。
在这里,你将:
● 全链路模型训练
○ 深度参与购物场景统一大模型的完整训练周期:预训练退火 → SFT → RLVR → RLHF
○ 你碰到的不是一个冻结的API,而是一个你可以从底层塑造的模型
● Agent框架设计——让大模型真正"能办事"
○ 设计大模型原生的Agent架构,通过Skill编排、Sub-agent协作等机制,将淘系搜索、推荐、交易、客服等全域能力注入AI助手
○ 让模型不只是"能聊",而是"能买、能比、能帮你做决定"
● 奖励信号发现——在真实场景中定义"什么是好"
○ 基于淘天数亿用户的真实交互行为,挖掘和设计最能提升用户体验的奖励信号
○ 用RL的方式让模型在电商场景下持续逼近SOTA体验
● 无人区探索——做业界还没有答案的事
○ 异步实时Agent:用户不等你,你怎么让Agent在真实时间约束下又快又好?
○ 原生Any-to-Any多模态:文字、图片、视频、商品卡片……如何让模型原生理解和生成一切?
○ 这些方向没有教科书,我们需要你带着自己的判断力走进去
为什么值得来?
● 场景稀缺性:数亿级日活用户 × 极其丰富的电商意图 × 可闭环的商业验证
● 技术纵深:从模型训练到Agent系统到产品体验,你可以一竿子插到底,而不是只做流水线上的一环
● 前沿密度:团队在RLVR、Agentic Training、多模态等前沿研究方向持续投入
● 影响力:你训练的模型、设计的Agent,会直接服务于淘宝用户
我们期待你:
● 在大模型预训练/SFT/RLHF/强化学习中有扎实的实战经验
● 对Agent/Tool-use/Multi-agent系统有深入理解,最好有设计和落地经验
● 具备从混沌中找到方向的能力——能在没有明确技术路线的情况下,做出有品味的技术判断
● 对"用AI重新定义购物体验"这件事有真正的兴趣
【文末扫码直达部门!避免出现货不对板,避免简历流转到公共池流浪!!】
淘天集团AI助手算法团队承担了淘天集团新一代AI原生购物助手的开发工作,通过统一的All in One大模型解决淘宝在不同场景的用户需求。团队在大模型强化学习、Agentic训练、原生多模态训练以及Agent框架设计有着行业领先的认知和实际落地效果。
在这里,你将:
● 全链路模型训练
○ 深度参与购物场景统一大模型的完整训练周期:预训练退火 → SFT → RLVR → RLHF
○ 你碰到的不是一个冻结的API,而是一个你可以从底层塑造的模型
● Agent框架设计——让大模型真正"能办事"
○ 设计大模型原生的Agent架构,通过Skill编排、Sub-agent协作等机制,将淘系搜索、推荐、交易、客服等全域能力注入AI助手
○ 让模型不只是"能聊",而是"能买、能比、能帮你做决定"
● 奖励信号发现——在真实场景中定义"什么是好"
○ 基于淘天数亿用户的真实交互行为,挖掘和设计最能提升用户体验的奖励信号
○ 用RL的方式让模型在电商场景下持续逼近SOTA体验
● 无人区探索——做业界还没有答案的事
○ 异步实时Agent:用户不等你,你怎么让Agent在真实时间约束下又快又好?
○ 原生Any-to-Any多模态:文字、图片、视频、商品卡片……如何让模型原生理解和生成一切?
○ 这些方向没有教科书,我们需要你带着自己的判断力走进去
为什么值得来?
● 场景稀缺性:数亿级日活用户 × 极其丰富的电商意图 × 可闭环的商业验证
● 技术纵深:从模型训练到Agent系统到产品体验,你可以一竿子插到底,而不是只做流水线上的一环
● 前沿密度:团队在RLVR、Agentic Training、多模态等前沿研究方向持续投入
● 影响力:你训练的模型、设计的Agent,会直接服务于淘宝用户
我们期待你:
● 在大模型预训练/SFT/RLHF/强化学习中有扎实的实战经验
● 对Agent/Tool-use/Multi-agent系统有深入理解,最好有设计和落地经验
● 具备从混沌中找到方向的能力——能在没有明确技术路线的情况下,做出有品味的技术判断
● 对"用AI重新定义购物体验"这件事有真正的兴趣
全部评论
相关推荐
查看25道真题和解析 点赞 评论 收藏
分享
