淘天实习agent岗位内推

👋 淘天技术-商家&开放平台团队|AI Agent 工程师(研发/优化方向)
📍 杭州

🛠️ 我们在创造什么?
我们正在完成一次关键跃迁:从“交付工具”到“交付 Agent”。不再让商家学复杂后台,而是让 AI 化身“数字店长”,自主驱动商品上新、客服接待、营销策划等全链路经营。
1/打造电商专用Agent OS构建端云一体的千牛Agent产品(支持本地代理+云端沙箱),通过记忆建模、任务规划、决策推理等核心算法与高安全运行时框架,让Agent化身“数字店长”,自主完成商品上新、客服接待、营销策划等全链路作业。
2/孵化万级Skill生态设计Skill智能调度与效果优化算法,结合AI PaaS安全集成能力,将客服、数据分析、内容生成等场景抽象为标准化Skill,共建“电商Skill应用市场”。
3/定义AI Native交互新标准研发A2UI(AI to UI)生成算法与交互框架,实现自然语言指令到经营界面的精准映射与秒级生成,让“所想即所得”成为现实。
4/驱动研发与算法范式升级构建Skill效果自动化评测-在线学习-AB测试闭环,全面落地AI Coding、AI CR、AI运维,用技术与算法双轮驱动持续提效,让Agent越用越聪明,让工程师专注创造。

🎯 加入后,你将
主导Agent核心算法模块(记忆管理、任务规划、决策推理)与运行时框架(上下文压缩、长短期记忆)的研发,设计高鲁棒性方案;
深耕商品管理、智能客服、营销策划等场景,将业务逻辑转化为高性能Skill算法(如对话策略优化、文案生成)或高可用Skill服务;
构建Skill工具链(自动化评测、Prompt优化、小样本训练)并参与AI PaaS平台建设,赋能生态开发者高效迭代;
与产品、业务专家深度协作,通过AB实验与数据洞察驱动迭代,从0到1验证Agent产品价值。

🚀 你能获得
真实战场:你的代码直接跑在千万商家的经营流里,扛得住双十一百万 QPS,也经得起日常业务检验。
顶配资源:前沿大模型矩阵、充足算力与 Token、专属集群,实验随便跑,想法快速验证。
全链成长:资深导师 1v1 + AI Coding 全流程实践 + 定期技术沙龙,快速打通 算法设计 → 训练 → 部署 → 业务迭代 闭环。

🎯 我们希望你具备
💻(一)AI Agent研发方向
📚 学历与专业
本科及以上学历,计算机、软件工程、人工智能、数据科学等相关专业。
⚙️ 技术能力
扎实的计算机基础(数据结构、算法、操作系统、网络),精通Java/Go/Python至少一门语言;
了解分布式系统核心概念(微服务、缓存、消息队列),对高并发、高可用系统有热情;
对AI技术有好奇心:熟悉Agent技术栈(RAG、Prompt Engineering、Agent Memory等),了解LangChain、Semantic Kernel等框架者优先;
有使用AI编程助手(通义灵码、Cursor等)辅助开发经验,认同"AI for Engineering"理念;
具备CV/NLP基础,了解大模型算法,有模型训练(SFT、RL)经验者优先。
🌟 实战经验(满足任一即亮眼)
参与过Agent/Skill开发、大模型应用、云原生项目或开源贡献;
在ACM、Kaggle、天池等竞赛中获奖,或拥有技术博客/专利;
熟悉前端框架(React/Vue)并对A2UI交互设计有实践思考;
有电商、SaaS、开放平台相关项目经验。

🧠(二)AI Agent优化方向
📚 学历与专业
本科及以上学历,人工智能、机器学习、计算机科学、数据科学等相关专业,具备扎实的数学与算法理论基础。
⚙️ 算法与工程能力
精通Python,具备扎实的数据结构与算法功底,能高效实现复杂算法逻辑;
深入理解Agent核心技术栈:熟悉RAG优化、Prompt Engineering、记忆机制、任务规划、MCP/A2A协议等,有LangChain/Semantic Kernel等框架实战经验者优先;
具备大模型应用算法经验:熟悉SFT、RLHF/DPO、模型蒸馏、推理加速等技术,在NLP/CV/多模态方向有项目实践;
掌握算法工程化能力:了解模型服务化(TensorRT、vLLM)、AB测试、效果归因分析,对高并发场景下的算法稳定性有敏感度;
有使用AI工具(通义灵码等)辅助开发经验,践行"AI for Engineering"理念。
🌟 实战经验(满足任一即亮眼)
参与Agent核心算法研发(记忆/规划/决策)、大模型应用优化、Skill效果提升等项目;
在ACM、Kaggle、天池等竞赛中获奖,或在ACL、KDD、WWW等顶会发表相关论文;
有电商、SaaS、开放平台领域算法项目经验,或对商品理解、营销生成、客服对话等场景有深度思考;
开源贡献:在HuggingFace、ModelScope等平台发布高质量算法模型或工具。

📩 投递方式:[邮箱/内推链接]
📎 邮件标题:姓名-学校-方向
发送到 **********

⬆️内推链接:https://campus-talent.alibaba.com/campus/position?campusShareCode=TUgNu3wAeGlAmgK6NqTAL1t1bnVCidX9akHl3jhm2is%3D&batchId=100000540002
项目:阿里巴巴2027届实习生
内推码:1RRQFL

期待与你一起,让淘宝因 AI 更聪明,也因“人”更温暖。🌼
全部评论

相关推荐

多智能体系统(Multi-Agent Systems)让一群AI Agent分工协作,看起来效率很高,但实际落地时,单个Agent的问题会被成倍放大:流程容易卡死、幻觉连锁传播、Token成本失控。以下是2026年生产环境中最常见的6个坑,以及对应的避开方法。1. 所有Agent都用同一个大模型现象:规划层、执行层、审计层统一用同一个强模型(比如全用Claude 3.5或Grok 4)。为什么坑大:思考能力强的模型被用来跑简单工具调用,Token成本直接拉高;同时不同Agent的输出风格互相干扰,幻觉更容易在链路中放大。避法:分层选模型。规划层(Supervisor)用思考强的模型,执行层Worker换更快、更便宜的专用模型(Qwen3、DeepSeek等)。混合使用能把整体Token成本降低约70%,每个Agent也更专注自己的角色。2. 只靠Prompt记录历史,不做状态管理现象:Agent之间的对话历史直接塞进Prompt,让它们“自己记住就行”。为什么坑大:任务稍长或出现分支,上下文就混乱,前面的决策后面被遗忘,或者重复执行无效步骤。避法:必须采用有状态的图结构(Stateful Graph)或Checkpoint机制。LangGraph在这方面做得成熟,每一步状态都能持久化、回溯和调试。不要把全部记忆压在Prompt上,那不是生产级做法。3. 缺少Verifier和人工干预节点现象:Agent数量增多后,一个Worker的幻觉直接传给后面的分析和写作Agent,最终输出看着合理,实际使用就出问题。为什么坑大:错误在链路中快速传导,生产环境风险极高。避法:在关键节点强制加入Verifier Agent,专门负责事实检查和一致性校验。同时在高风险步骤保留Human-in-the-Loop(人工审核点)。2026年成熟系统几乎都会在全自动链路中加把关机制。4. 工具集成和Agent间通信全靠自定义胶水代码现象:自己手写代码去连接工具、传递消息。为什么坑大:维护成本高,换框架或需要扩展时要重写大量代码。避法:优先采用标准协议。MCP(Model Context Protocol)让Agent以统一方式发现和使用工具,像插统一的“USB接口”一样接入浏览器、API、数据库。A2A(Agent-to-Agent Protocol)负责Agent之间标准发现和委托任务。2026年主流框架都在支持这两个协议,用它们能大幅减少自定义代码,系统也更容易跨框架扩展。5. 一上来就用完全去中心化的Swarm模式现象:所有Agent平等协作,追求“涌现智能”。为什么坑大:复杂任务容易出现死锁、互相等待或输出冲突,调试难度极大。避法:大多数生产场景先从分层结构(Hierarchical)入手——上方Supervisor负责拆任务、分配和汇总,下方是专注的Worker。系统跑稳后再在局部引入Swarm式的并行协作。分层结构控制力强、审计方便,是2026年企业落地最广泛的模式。6. 忽略整体成本和监控现象:集群跑起来后,Token消耗、延迟、错误率失控,尤其是多个Worker并行执行时。为什么坑大:账单和系统稳定性同时出问题。避法:从一开始就接入可观测性工具(LangSmith、Langfuse等),实时监控每个Agent的调用次数、Token用量和成功率。定期压缩记忆,避免历史越积越多。同时设置预算阈值和自动降级机制(复杂任务失败时切换到更简单的流程)。搭AI Agent集群,本质上是搭建一个“数字员工团队”。团队越大,分工必须越清晰,协作协议必须越标准,检查机制必须越严格。避开以上6个坑,系统才能从“看起来能跑”变成“真正稳定、好维护、成本可控”。原文:https://x.com/dss_ws14043/status/2038804249669411229,个人推特。
大厂实习和小厂实习最大的...
点赞 评论 收藏
分享
查看15道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务