淘天集团-淘宝APP AI助手算法团队-多模态/大模型应用-开始校招实习啦!
【内推码:XK7ECI】
【文末扫码直达部门!避免出现货不对板,避免简历流转到公共池流浪!!】
淘天集团AI助手算法团队承担了淘天集团新一代AI原生购物助手的开发工作,通过统一的All in One大模型解决淘宝在不同场景的用户需求。团队在大模型强化学习、Agentic训练、原生多模态训练以及Agent框架设计有着行业领先的认知和实际落地效果。
在这里,你将:
● 全链路模型训练
○ 深度参与购物场景统一大模型的完整训练周期:预训练退火 → SFT → RLVR → RLHF
○ 你碰到的不是一个冻结的API,而是一个你可以从底层塑造的模型
● Agent框架设计——让大模型真正"能办事"
○ 设计大模型原生的Agent架构,通过Skill编排、Sub-agent协作等机制,将淘系搜索、推荐、交易、客服等全域能力注入AI助手
○ 让模型不只是"能聊",而是"能买、能比、能帮你做决定"
● 奖励信号发现——在真实场景中定义"什么是好"
○ 基于淘天数亿用户的真实交互行为,挖掘和设计最能提升用户体验的奖励信号
○ 用RL的方式让模型在电商场景下持续逼近SOTA体验
● 无人区探索——做业界还没有答案的事
○ 异步实时Agent:用户不等你,你怎么让Agent在真实时间约束下又快又好?
○ 原生Any-to-Any多模态:文字、图片、视频、商品卡片……如何让模型原生理解和生成一切?
○ 这些方向没有教科书,我们需要你带着自己的判断力走进去
为什么值得来?
● 场景稀缺性:数亿级日活用户 × 极其丰富的电商意图 × 可闭环的商业验证
● 技术纵深:从模型训练到Agent系统到产品体验,你可以一竿子插到底,而不是只做流水线上的一环
● 前沿密度:团队在RLVR、Agentic Training、多模态等前沿研究方向持续投入
● 影响力:你训练的模型、设计的Agent,会直接服务于淘宝用户
我们期待你:
● 在大模型预训练/SFT/RLHF/强化学习中有扎实的实战经验
● 对Agent/Tool-use/Multi-agent系统有深入理解,最好有设计和落地经验
● 具备从混沌中找到方向的能力——能在没有明确技术路线的情况下,做出有品味的技术判断
● 对"用AI重新定义购物体验"这件事有真正的兴趣
【文末扫码直达部门!避免出现货不对板,避免简历流转到公共池流浪!!】
淘天集团AI助手算法团队承担了淘天集团新一代AI原生购物助手的开发工作,通过统一的All in One大模型解决淘宝在不同场景的用户需求。团队在大模型强化学习、Agentic训练、原生多模态训练以及Agent框架设计有着行业领先的认知和实际落地效果。
在这里,你将:
● 全链路模型训练
○ 深度参与购物场景统一大模型的完整训练周期:预训练退火 → SFT → RLVR → RLHF
○ 你碰到的不是一个冻结的API,而是一个你可以从底层塑造的模型
● Agent框架设计——让大模型真正"能办事"
○ 设计大模型原生的Agent架构,通过Skill编排、Sub-agent协作等机制,将淘系搜索、推荐、交易、客服等全域能力注入AI助手
○ 让模型不只是"能聊",而是"能买、能比、能帮你做决定"
● 奖励信号发现——在真实场景中定义"什么是好"
○ 基于淘天数亿用户的真实交互行为,挖掘和设计最能提升用户体验的奖励信号
○ 用RL的方式让模型在电商场景下持续逼近SOTA体验
● 无人区探索——做业界还没有答案的事
○ 异步实时Agent:用户不等你,你怎么让Agent在真实时间约束下又快又好?
○ 原生Any-to-Any多模态:文字、图片、视频、商品卡片……如何让模型原生理解和生成一切?
○ 这些方向没有教科书,我们需要你带着自己的判断力走进去
为什么值得来?
● 场景稀缺性:数亿级日活用户 × 极其丰富的电商意图 × 可闭环的商业验证
● 技术纵深:从模型训练到Agent系统到产品体验,你可以一竿子插到底,而不是只做流水线上的一环
● 前沿密度:团队在RLVR、Agentic Training、多模态等前沿研究方向持续投入
● 影响力:你训练的模型、设计的Agent,会直接服务于淘宝用户
我们期待你:
● 在大模型预训练/SFT/RLHF/强化学习中有扎实的实战经验
● 对Agent/Tool-use/Multi-agent系统有深入理解,最好有设计和落地经验
● 具备从混沌中找到方向的能力——能在没有明确技术路线的情况下,做出有品味的技术判断
● 对"用AI重新定义购物体验"这件事有真正的兴趣
全部评论
相关推荐
03-19 17:53
武汉大学 算法工程师
暴杀流调参工作者:春招又试了一些岗位,现在投递很有意思,不仅要精心准备简历,投递官网还得把自己写的东西一条一条复制上去,阿里更是各个bu都有自己的官网,重复操作无数次,投完简历卡完学历了,又该写性格测评、能力测评,写完了又要写专业笔试,最近还有些公司搞了AI辅助编程笔试,有些还有AI面试,对着机器人话也听不明白录屏硬说,终于到了人工面试又要一二三四面,小组成员面主管面部门主管面hr面,次次都没出错机会,稍有不慎就是挂。
卡学历卡项目卡论文卡实习什么都卡,没有不卡的😂 点赞 评论 收藏
分享

查看12道真题和解析