卢先生_阿里巴巴集团

AI Infra工程师-计算方向-阿里巴巴2027届实习生

薪资面议

上海/杭州/北京

本科

展开

岗位职责

AI 时代的到来为云计算的进一步发展提供了前所未有的广阔舞台，为云计算基础设施带来全新的机遇和挑战。加入我们一起打造 AI 时代持续领先的计算基础设施，依托阿里自研神龙虚拟化架构、CIPU处理器、灵骏智算、以及业界领先的云计算调度能力和容器化管理能力等，你将参与构建支撑亿级计算核心、十万卡级 GPU 集群的规模的 AI 计算基础设施。我们致力于通过软硬件协同优化、虚拟化与容器化技术创新，解决模型训练、模型推理，Agent、超大规模资源调度全链路中的极致工程挑战。你的代码将直接运行在阿里核心的计算产品中——决定大模型分布式训练的通信效率、推理引擎的响应延迟、GPU 集群的资源利用率，以及百万级服务器的弹性调度与智能运维。加入我们，全球顶尖 AI 模型注入最强劲的算力引擎！具体的职责包括以下相关方向的一项或多项： 1. 算力基建与分布式训练加速： ● 深入分布式训练架构，优化集合通信（AllReduce/AllGather）与底层算子性能，解决大规模集群通信瓶颈，提升模型训练的吞吐量与计算效率；参与研究新的训练框架和并行模式（DP/TP/PP/EP）。 ● 针对大规模推理场景，研发高性能推理引擎，通过 Kernel 优化、KV Cache 管理、框架改进与算法协同优化等手段，实现极致的低延迟与高并发。 2. 高性能网络与通信基础设施： ● 研发面向 AI 超算的大规模高性能网络（200G/400G/800G）及通信基础设施, 优化降低分布式训练与推理的网络传输延迟。 ● 负责 AI/高性能计算所需的高性能分布式通信框架研发，优化容器网络性能，保障海量任务的极致通信效率。 3. 加速计算与 GPU 集群管理： ● 持续探索前沿 GPU 架构设计与技术，结合业务需求构建高可用、高可靠、可扩展的加速计算技术体系。 ● 构建加算计算算力统一管理系统，实现智算集群中 GPU 资源的全面监控、质量巡检、故障预测与性能水平标定（SLO），保障算力资源的稳定一致性。 4. 虚拟化与系统软件研发： ● 在 Intel/AMD/ARM 等新硬件平台进行 Hypervisor 关键特性研发，使能硬件加速能力（VT-x/EPT/SR-IOV），基于 DPU/CIPU 的加速与卸载方案研发，降低虚拟化性能开销。 ● 负责云平台 CPU 调度器/内存管理系统/IO 资源虚拟化的设计研发与优化，提升资源利用效率与运维弹性，为Agentic AI提供可靠、高效、低成本的执行环境。 ● 基于 TDX/SEV 等硬件安全能力，打造面向 AI 场景的机密计算解决方案，保护云上租户的模型与数据安全。 5. 容器化调度与编排优化： ● 深度优化 Kubernetes 调度器，实现面向 GPU 拓扑感知的算力分配，解决大规模分布式训练任务的资源碎片化问题。 ● 研发面向 AI 推理与 Agent 运行的轻量化沙箱算力，实现计算资源的极致弹性与高密部署。 ● 设计并实现面向 AI 工作负载的弹性调度策略，通过多级缓存、预加载等手段，实现 AI 任务与 Agent 的秒级快速拉起与自动伸缩。 6. 智能化集群管理与 AIOps： ● 构建超大规模基础设施的智能化集群管理系统，涵盖资源调度、监控报警、自动化运维等核心能力，实现算力资源的弹性分配与自动化运维闭环。 ● 设计研发自主智能运维 Agent，通过自动故障感知、根因定位与自愈决策闭环，提升大规模集群的运维效率与稳定性。 7. AI 工程平台与效率提升： ● 打造一体化的 AI 研发平台，覆盖大模型训练、推理、调度的全流程，降低模型迭代门槛，提升研发效能。 ● 探索 Serverless 等新场景下面向 AI 计算的解决方案，设计研发基于 AI 的智能应用弹性及资源弹性产品能力，推动端到端弹性伸缩优化。"

岗位要求

1. 基础条件： ● 计算机、软件工程、人工智能等相关专业优先。 ● 热衷于数据结构和算法，在 ACM/ICPC 等竞赛中成绩优异者优先。 ● 在系统、体系结构或 AI 领域顶会（如 OSDI, SOSP, ASPLOS, ISCA, MICRO, MLSys, SIGCOMM, NSDI 等）发表过论文，或在核心开源项目中有重大贡献（Maintainer/Committer）者优先考虑。 2. 专业能力（系统工程与计算底座）： ● 系统编程功底：精通 C/C++、Go、Python 或 Rust 中至少一门语言，具备扎实的系统级编程能力。熟悉 Linux 内核（调度器、内存管理、网络栈、文件系统、cgroups）及高性能网络开发（Socket, RDMA, DPDK/SPDK），具备极强的底层工程实现与缺陷排查能力。 ● 分布式系统与云原生：深刻理解分布式系统基本原理（如一致性、容错、扩展性等）；对 Kubernetes 架构有一定理解，熟悉容器 Runtime（Docker/containerd/CRI）原理者优先；了解虚拟化技术（KVM/QEMU/Xen）或 DPU/智能网卡架构者加分。 3. AI 计算领域专业知识（满足其一即可）： ● 了解 AI 的基本原理与常见算法，理解模型训练/推理任务的基本流程及其资源需求（如显存、带宽、通信模式），了解主流训练推理框架（如 PyTorch、Megatron-LM、DeepSpeed、vLLM、SGLang）的基本使用方式。 ● 了解异构计算或高性能计算体系，熟悉 GPU 体系结构（PCIe/NVLink/NVSwitch）及相关编程模型（CUDA），有 GPU 相关优化经验者优先。 ● 熟悉容器化环境下 AI 任务的架构及部署链路，了解如何通过容器/虚拟化技术优化模型加载、Checkpoint 保存、Memory 管理等环节。 ● 了解 x86/ARM 体系结构，熟悉 CPU 虚拟化（VT-x）、内存虚拟化（EPT）、IO 虚拟化（SR-IOV/VFIO）等核心模块原理者优先。 4. 能力特质： ● 全局技术视野：具备跨域的技术视野，能从""GPU 算子 → HBM 显存 → NVLink/PCIe 总线 → RDMA 网卡 → 分布式调度器 → K8s 编排""的全链路视角拆解计算流程，准确把握计算、网络与调度的边界权衡。 ● 系统思维与极致追求：乐于挑战复杂系统的性能极限，熟练使用各种 Profiling & Tracing 工具（如 eBPF、perf、ftrace、Nsight Systems、flamegraph），善于从 CPU 缓存未命中、上下文切换、锁竞争等微观视角定位并解决性能瓶颈。 ● 业务驱动与跨域协同：对 AI 大模型技术充满热情，不仅能交付高质量的系统级代码，更能与算法科学家、模型训练专家进行深度技术对话，将模型侧的痛点精准转化为底层计算基础设施的工程解法。 ● 极客精神：具备快速学习新技术的能力，渴望在高性能计算与大规模算力平台的交汇处实现技术突破；拒绝纸上谈兵，有自己独立完成的技术项目或开源贡献，展现极客精神。【加分项】 ● 在 GitHub 等开源社区有较大影响力的技术项目，作为 Collaborator/Committer/Member 优先；有 K8s/容器相关开源社区贡献（Kubernetes/KubeFlow/Volcano/OpenKruise 等）或 Linux 内核社区贡献者加分。 ● 有高性能网络/RDMA 开发经验，或有 GPU 编程（CUDA）与性能优化实战经验。 ● 有虚拟化/DPU/智能网卡开发经验，或有在离线混部、长尾延时优化等系统调优经验。 ● 获得过业界有影响力的专利

算法工程师-AIGC数字人视频生成（T-Star Lab）-阿里巴巴2027届实习生

薪资面议

北京

本科

展开

岗位职责

如果你，期望在阿里巴巴生态的广阔场景中，借助海量用户数据和先进的技术能力，打造千人千面的个性化数字人形象生产系统，为亿级用户提供高度定制化的虚拟形象服务；如果你，期望攻克高保真语音驱动（Speech-to-Video）的核心难题，研发业界领先的唇形同步、情绪化面部表情及肢体动作生成算法，实现从音频到视频的端到端极致还原，赋予数字人如同真人般的自然表达力与情感共鸣；如果你，期望挑战实时流式生成的技术难题，探索扩散模型与自回归模型的极速推理优化，实现低延迟、高吞吐的视频流实时产出，打破离线渲染的局限，支撑起百万级并发的实时交互直播场景；如果你，期望突破数字人与物理世界的边界，深耕复杂物体交互（Human-Object Interaction）技术，解决数字人在手持商品、展示道具等动态交互过程中的物理规律约束、空间一致性及遮挡还原难题，让数字人在导购、演播等场景中具备真实的物体操控能力；如果你，期望深入探索多模态统一大模型的应用，将视觉、语音、文本与动作序列深度融合，构建具备精细环境感知与逻辑理解能力的数字人系统，在复杂的电商实景中实现人-物-场的高度协同与自然对答。加入我们，你的成果将直接应用于电商领域的核心场景——AI实时直播、智能客服、交互式数字导购，影响数以亿计的用户。在这里，你不仅是在写代码，更是在通过流式架构与交互算法，重新定义未来数字人的无限可能！研究背景：在 AIGC 浪潮下，数字人已从早期的录像进化为动态实时生成。然而，业界仍面临三大核心挑战： 1、交互的自然度：如何让数字人的肢体、表情与复杂的语音情感高度对齐，消除“恐怖谷”效应； 2、物理规律的缺失：在电商直播等场景中，数字人需要手持商品、展示道具，如何解决手部交互（HOI）中的遮挡、形变及空间一致性是当前的技术深水区； 3、实时性的瓶颈：扩散模型效果虽好但推理慢，如何实现低延迟的流式视频生成，是数字人从视频工具走向实时互动的必经之路。研究课题： 1、基于扩散模型的高保真流式视频生成架构研究； 2、复杂场景下的人与物体交互（HOI）视频生成； 3、多模态情感驱动的全身动作与表情协同生成。成长资源： 1、算力自由：远离“算力焦虑”，专注于算法创新； 2、海量高质数据：拥有业界独有的、极其丰富的多模态商业场景数据，为视频生成、HOI等前沿课题提供土壤; 3、鼓励顶会产出：团队在保持业务领先的同时，高度重视学术沉淀。鼓励将研究成果总结并发表至CVPR、SIGGRAP、HNeurIPS 等顶会，支持参加国际学术会议，提升行业影响力； 4、工业界顶级专家的 1v1 指导：团队由来自国内外顶尖院校的博士和工业界资深专家组成，实行“师兄制”，从学术论文投稿到工程落地全过程深度带教。

岗位要求

1、计算机/电子/人工智能/多媒体技术等相关专业，毕业时间在2026年11月以后得硕士及以上学历在校生； 2、熟悉视频时序一致性处理、长视频生成、动作迁移或视频补全等技术； 3、精通 Python，熟悉 PyTorch / TensorFlow 等至少一种主流深度学习框架； 4、具备良好的代码习惯，能高效实现前沿论文算法，并进行复现与改进。【加分项】 1、在相关领域国际会议发表有影响力的一作CCF-A论文； 2、作为主要参与者参与有业界影响力的技术工作。

AI Infra操作系统工程师-阿里巴巴2027届实习生

薪资面议

上海/杭州/北京

本科

展开

岗位职责

在这里，你将成为大模型技术落地的"幕后推手"。你将参与构建支撑千卡/万卡规模的 AI 计算基础设施，通过软硬件协同优化，解决大模型在训练、推理、Agent 基础设施中的工程挑战。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率，为 AI 时代的算力底座注入核心动力。具体的职责包括以下相关方向的一项或多项： 1. 面向 AI Infra 的操作系统：参与核心模块的设计与开发，包括 AI 训练、推理与 Agent 任务的资源调度、内存/显存管理、文件系统等底层系统的研发与优化。 2. 极致训练、推理与 Agent 软硬件协同优化：通过操作系统、Agent Sandbox、CUDA Runtime、KVCache 全栈优化 AI 工作负载 // 面向AI服务器优化，软硬件协同优化。 3. 工程效能提升与智能化：设计和实施系统级测试方案，包括单元测试、集成测试、性能测试和压力测试,保障系统稳定性和可靠性。 4. 运维监控系统建设：负责AI算力平台的日常运维、故障排查和性能监控,构建自动化运维工具和可观测性体系。 5. AI 可信计算体系建设：参与 AI Infra 以及 AI Agent 系统安全机制设计，包括资源隔离、权限控制、漏洞修复等，保障多租户环境下的系统安全技术探索。 6. 前沿 AIOS 技术探索：跟踪 AI Infra 前沿技术，探索 AI 与操作系统融合的创新方向，推动 AIOS 技术演进和开源社区贡献。

岗位要求

专业领域： 1. 计算机、软件工程、电子工程或相关专业。 2. 热衷于数据结构和算法、在ACM大赛成绩优异者优先；有顶会论文/高影响项目/开源贡献者加分。 3. 专业能力： ○ 系统工程与编程能力：具备良好的系统工程基础，熟悉 Linux 开发环境，掌握 Python、C/C++、Rust、Go 等至少一门编程语言，具备扎实的工程实现能力； ○ AIOS 系统领域专业知识：对于以下领域中的一项或者多项具备专业能力； ○ 了解 Linux 操作系统内核机制，具备扎实的系统级编程能力。有Linux内核开发、虚拟化技术、容器运行时、分布式系统或 AI 算力优化相关经验优先； ○ 了解 GPU 架构和 CUDA 编程，了解主流模型推理框架的运行机制。有 Pytorch、SGLang、vLLM、Mooncake 等开源项目经历优先； ○ 了解系统级测试方法和自动化测试框架。具备性能测试和压力测试实习经历的加分； ○ 了解系统监控和可观测性技术。熟悉 Prometheus、Grafana等监控工具； ○ 了解系统安全机制，包括资源隔离、权限控制、漏洞修复等。例如：了解操作系统安全机制，有 Confidential Containers 等开源项目经历； ○ 加分项：参与过开源操作系统项目、AI 基础设施项目或在系统顶会（OSDI/SOSP/ASPLOS）发表过论文。 AI 能力： 1. 问题解决：善于把复杂的系统工程挑战拆解为可优化的明确目标，判断哪些环节适合自动化、哪些需要人工干预和深度调优。 2. 批判性思考：对操作系统性能数据和 AI 工具的优化建议保持审慎，能识别瓶颈根源，不盲信表面指标，愿意深入底层验证和追问。 3. 学习判断力：对 AI Infra 和 OS 新技术有强烈好奇心，能快速上手并评估新工具、新框架对现有系统架构的真实价值。 4. 协作沉淀：能与多种角色围绕 AI 基础设施高效协同，善用 AI 编程工具提升效率，将个人实践转化为团队可复用的工具和流程。

航空网络规划-阿里巴巴2027届实习生

薪资面议

杭州/深圳

本科

展开

AI应用研发工程师-终端方向-阿里巴巴2027届实习生

薪资面议

杭州/北京

本科

展开

岗位职责

聚焦核心业务场景，利用Agent利用Agent等前沿技术推动AI在前端、客户端等全终端方向落地。你将参与从需求洞察到AI应用构建开发的全流程，推进AI应用的落地。 1.AI应用全端开发：—>AI应用全终端开发 ● 负责AI在全终端方向的应用开发和优化。 ● 参与AI终端和服务端的交互协议的设计、实现和优化。 2.AI应用基础组件开发： ● 负责AI应用全终端SDK的架构设计、开发和优化。 ● 负责终端基础组件及架构设计, 推进研发效率； 3.性能优化： ● 负责优化前端、客户端等全终端SDK/App性能、体验优化及质量监控评估体系建设。 4.3D实时渲染： ● 负责利用AI能力，在终端实现2D/3D实时渲染技术的开发和优化。

岗位要求

1.基础条件 ● 计算机、软件工程、人工智能等相关专业优先。 2.专业能力 ● AI编程工具重度玩家：Cursor、Claude code等AI编程工具重度或顶级玩家，具备极强的Prompt编写与调优能力，有过完整的项目级开发经验，理解如何让AI写出生产级代码。 ● 大模型能力理解与掌握：理解主流LLM的能力与局限，能够清晰拆解任务并通过LLM或确定性逻辑兜底实现；熟悉主流大模型的应用范式(Context Engineering、Prompt Engineering、Agent、工具/函数调用等等)及主流Agent框架(如LangChain等)，具备大模型幻觉、Prompt注入等风险的工程化应对思路。 ● 扎实的代码和工程能力：掌握扎实的编程基础，包括数据结构、算法、计算机网络、操作系统等基础知识；熟悉多种编程语言，至少精通一门，包括但不限于C/C++、JS、Java、Objective-C、Swift、TS等，熟悉多线程、内存管理、性能优化等核心机制。 ● 跨平台开发能力：具备跨平台全终端开发能力，包括但不限于Web/iOS/Android/鸿蒙/Windows/MacOS/Linux//RTOS等；具备良好的 Node.js开发能力。 3.能力特质 ● 学习能力：具备快速啃透前沿论文（Paper）的能力，并能将理论知识转化为工程代码。 ● 开放性与动手能力：拒绝纸上谈兵，有自己独立完成的小项目（开源项目或个人 Demo），展现极客精神。 ● 好奇心与想象力：面对未知事物有独特的想法，具备敏锐的问题定义能力和坚韧的解决问题能力。 ● 审美追求：技术亦有审美，鼓励你提出能提出打动人心、简洁优雅的好想法。 ● 高能动性：具备强烈的自驱力，能够主动探索边界，而不是等待被分配任务。 4.加分项 ● 有AI应用或Agent实际落地经验：有全终端AI应用项目研发落地经验优先。 ● 开源贡献或技术影响力：在Github上有高质量AI项目、技术博客或社区影响力。

算法工程师-运筹&因果推断（AI物流智能决策）-阿里巴巴2027届实习生

薪资面议

上海/北京

本科

展开

Agent Infra操作系统研发工程师-阿里巴巴2027届实习生

薪资面议

上海/杭州/北京/深圳

本科

展开

岗位职责

1. 操作系统及内核研发：面向 Agent 工作负载的操作系统能力演进，推动内核子系统与上层系统组件的适配与创新，构建 Agent 与 OS 之间的交互接口与运行时基础设施。 2. 安全底座：构建 OS 级的 Agent 安全体系，在供应链安全、运行时安全隔离、OS 级行为审计与访问控制等方向建立纵深防御。 3. 智能化运维：探索 AI 与系统运维深度结合的模式，将操作系统运维知识封装为 Agent 可理解、可执行的能力，推动运维从人工经验驱动向智能化演进。 4. 可观测与效能优化：构建面向 Agent 行为的可观测体系，度量和优化 Agent 运行效能，从 OS 层系统性降低 Agent 运行成本。 5. 工程平台建设：构建面向操作系统研发场景的 Agent 基础设施平台，将各方向的 Agent 能力进行平台化沉淀，支撑 Agent 的规模化开发、运行与迭代。

岗位要求

专业领域： 1. 计算机科学、软件工程或相关专业。 2. 基础知识扎实，熟悉计算机体系结构、操作系统原理、网络、分布式系统、算法与数据结构等领域；在 ACM 大赛成绩优异者优先，有顶会论文/高影响项目/专利/开源贡献为加分项。 3. 专业能力： ● 系统工程与编程能力 ○ 有扎实的系统工程基础，熟悉 Linux 开发环境，具备工程实现能力； ○ 扎实掌握 Python、C/C++、Rust、Go、Java 等编程语言中的一种或几种。 ● 操作系统领域专业知识（对操作系统与基础软件有热情，对于以下领域中的一项或者多项有了解） ○ 了解 Linux 操作系统与发行版，具备扎实的系统级编程和优化能力。例如：有 Linux 内核开发、虚拟化技术、容器运行时、基础库等经验； ○ 了解计算机体系结构，可以为数据中心的软硬件基础设施进行操作系统级适配和协同优化。例如：有软硬件协同优化或芯片适配相关经历； ○ 了解系统安全机制，例如：软件供应链安全、系统权限控制与审计等； ○ 了解系统可观测技术、系统运维与性能优化方法，熟悉常见运维工具与性能调优手段，对 AI 驱动的智能化运维方向有兴趣。 ● Agent 工程能力（对于以下领域中的一项或者多项有了解） ○ 了解 Agent 架构与工作流设计，能基于主流 LLM API 进行基本的 Agent 搭建与工程落地，了解 Agent Skill 的设计与封装方法。例如：有将 Agent 集成到实际系统或工具链中的项目经历； ○ 了解 AI 编程工具的实际应用，能基于自主代理执行工具构建面向操作系统场景的 Agent 任务。例如：有利用 Claw 类工具、AI 编程工具完成系统运维、内核调试、日志分析等实际任务的经历； ○ 了解 Agent 评测方法，关注 Agent 在系统级场景中的效果度量与质量保障。例如：有使用流行的 Agent 评测框架的经历。 AI 能力： 1. 问题解决：善于从复杂的操作系统与基础软件问题中识别适合构建 Agent 能力的环节，判断哪些场景用传统系统工程方案更可靠、哪些适合通过 Agent 来解决。 2. 批判性思考：对技术选型保持审慎，能评估端到端 Agent 方案在系统级场景下的真实可行性与安全边界，不为了用 AI 而用 AI。 3. 学习判断力：对新技术有强烈好奇心，能在操作系统与基础软件的传统能力和 Agent 技术栈之间建立连接，快速评估新工具的生产价值。 4. 协作沉淀：能与不同角色围绕 Agent 能力高效协同，善用 AI 编程工具提升多语言开发效率，将实践经验转化为团队可复用的工程方案。

AI Infra软硬结合网络研发工程师-阿里巴巴2027届实习生

薪资面议

杭州

本科

展开

岗位职责

在这里，你将成为大模型技术落地的“硬核引擎缔造者”。你将参与构建 AI Infra计算基础设施过程，通过软硬件协同优化技术，近距离与大模型设计者协同设计，通过网络计算融合、网络存储融合、异构计算加速等软硬件结合优化技术，让每一个GPU发挥出极致性能，让大模型在训练、推理、调度全链路中的表现出卓越性能。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率，为 AI 时代的算力底座注入核心动力。 1. 基于FPGA/ASIC芯片的设计与开发： •负责FPGA/ASIC芯片的RTL设计与验证，包括C-Model、算法映射、硬件架构设计和性能调优； •开发硬件抽象层（HAL）和相关工具链，支持硬件加速器与上层软件的无缝集成； •参与硬件加速器及系统仿真模型的开发和调试。 2. 软硬件结合技术开发和优化： •研发基于FPGA、ASIC等硬件的计算平台，实现高性能网络加速，网络与计算加速，网络与存储加速等开发优化，提升AI训练和推理等业务的计算性能； •基于自研芯片，加速计算与计算之间，计算与存储之间，计算云服务之间的高性能，低延时互联，实现AI和通用计算的超节点高效互联。 3. 操作系统与固件开发： •优化Linux内核、设备驱动和固件，发挥硬件的极致性能，提升硬件资源利用率； •开发针对特定硬件的定制化操作系统模块，满足高性能计算、高性能网络需求。

岗位要求

1. 快速学习与创新能力： •具备快速学习新技术的能力，能够不断突破软硬件结合领域的技术瓶颈； •对前沿技术保持敏感，勇于探索未知领域，随时准备好迎接新挑战； 2. 扎实的软硬件基础： •熟悉计算机体系结构、操作系统原理、网络协议和分布式系统； •具备硬件设计经验（如FPGA、ASIC）或嵌入式开发经验，熟悉Verilog/VHDL等硬件描述语言； 3. 编程能力： •精通至少一种编程语言（如C/C++、Python、Go），具备良好的代码风格和工程实践能力； •熟悉底层开发（如驱动开发、固件开发）和高性能分布式并行计算开发，熟悉CUDA kernel开发； 4. 广阔的技术视野： •在软硬件结合领域有实际项目经验，能够从系统层面分析和解决问题； •熟悉云计算及相关产品，熟悉数据中心计算，存储，网络相关的技术； •了解前沿的AI技术，对AI所需的硬件系统有比较好的了解； 5. 团队协作与沟通能力： •具备良好的沟通能力和团队协作精神，能够在跨团队项目中高效合作； •能够清晰表达技术方案，并推动复杂项目的落地实施。加分项: 1. 有AI应用或Agent实际落地经验：包括不限于RAG系统、多智能体编排、结合MCP、Skill等的Agent项目，有可展示的项目/实习成果者优先。 2. 开源贡献或技术影响力：在Github上有高质量AI项目、技术博客或社区影响力。 3. 对AI Infra有基本理解：了解vLLM、Ollama等推理框架原理，理解延迟优化、KV cache优化、流式输出等工程全景视角。

AI Infra工程师-存储方向-阿里巴巴2027届实习生

薪资面议

成都/上海/杭州/深圳/北京

本科

展开

岗位职责

在这里，你将成为大模型时代算力底座的“核心引擎构造者”。依托阿里自研分布式存储系统与业界领先的计算网络架构，你将参与构建支撑千卡/万卡乃至十万卡规模的 AI 计算基础设施。我们致力于通过软硬件协同优化、存算分离架构创新，解决大模型在预训练、微调、推理全链路中的极致工程挑战。你的代码将直接运行在阿里核心的 AI 存储产品中，决定千万级并发的数据加载吞吐、秒级 Checkpoint 的可靠性以及庞大 GPU 集群的 MFU（模型算力利用率）。加入我们，为全球顶尖 AI 模型注入最澎湃的数据动力！具体的职责包括以下相关方向的一项或多项： 1. 面向 AI 计算的高性能存储系统研发：针对 AI 工作负载复杂且严苛的 I/O 特征（如海量小文件的高并发元数据检索、超大块数据的并行顺序流），进行内核态与协议栈级别的深度优化。主导研发基于 NVMe、RDMA/RoCEv2/eRDMA 的超低延时存储网络链路。 2. 极致性能的数据加载（Data Pipeline）与缓存加速：深度剖析大模型训练的数据读取链路，解决万卡集群下的 I/O 阻塞（I/O Bottleneck）与长尾延迟问题。研发面向大模型的分布式多级缓存与数据预取引擎，确保数据吞吐完全满足 GPU 显存带宽需求，实现计算与存储的完美 Overlap。 3. 云原生 AI 存储编排与智能化调度：结合 Kubernetes 生态构建云原生数据编排系统（如主导或参与 CNCF Fluid 等项目），将存储系统与计算调度平台深度集成。实现存算感知调度（Data-aware Scheduling）与弹性扩缩容，根据计算任务拓扑动态调整数据副本与亲和性策略，保障全网存储资源的极致效率。 4. Checkpointing 极致加速与容灾：针对超千亿/万亿参数模型的断点续传（Fault Tolerance）需求，设计高性能分布式持久化方案。通过内存-SSD-对象存储的分层拓扑、异步流式写入（Async I/O）、拓扑感知（Topology-aware）路由以及 GPUDirect Storage (GDS) 等技术，实现百 GB/TB 级模型权重的秒级保存与恢复，极大降低计算资源的闲置浪费。 5. 面向 Agent 使用场景的存储系统研发：通过分布式数据、元数据管理和高性能的分布式一致性协议等技术，支持海量 Agent 下的数据规模以及 IO 访问安全隔离、性能隔离。

岗位要求

1. 基础条件： ● 计算机、软件工程及相关专业。 ● 热衷于数据结构和算法，在 ACM/ICPC 等大赛中成绩优异者优先。 ● 在分布式系统、存储或操作系统领域顶会（如 FAST, OSDI, SOSP, SIGCOMM, NSDI 等）发表过一作论文，或在核心开源存储项目中有重大贡献（Maintainer/Committer）者优先考虑。 2. 专业能力（系统工程与分布式底座）： ● 系统编程功底：精通 C/C++ 或 Go/Rust，具备扎实的系统级编程能力。熟悉 Linux 内核（VFS, Block Layer, Memory Management）及高性能网络开发（Socket, RDMA, DPDK/SPDK），具备极强的底层工程实现与缺陷排查能力。 ● 分布式系统：深刻理解分布式系统理论（如 Paxos/Raft 一致性协议、分布式锁、纠删码 EC、数据分片与副本管理、分布式事务）。具备大规模分布式存储（如 HDFS, Pangu）的研发或深度调优经验。 3. AI 存储领域专业知识（满足其一即可）： ● 深入理解 AI 训练与推理的 I/O 模式，熟练掌握底层数据加载机制（如 PyTorch Dataloader），熟悉 Megatron-LM, DeepSpeed, Ray, vLLM 等主流分布式训练/推理框架的存储诉求。 ● 熟悉高性能存储协议及硬件架构，有 NVMe-oF, PCIe, CXL, GPUDirect Storage (GDS) 相关驱动开发与性能压测经验。 ● 深刻理解云原生架构，有大规模 Kubernetes 集群下的存储 CSI、数据缓存编排调优经验。 4. 能力特质： ● 全局技术视野：具备跨域的技术视野，能从“GPU 寄存器 -> HBM 显存 -> PCIe 总线 -> eRDMA 网卡 -> 分布式磁盘”的全链路视角拆解数据流动，准确把握计算、网络与存储的边界权衡。 ● 系统思维与极致追求：乐于挑战复杂系统的性能极限，熟练使用各种 Profiling & Tracing 工具（如 eBPF, perf, ftrace, Nsight Systems），善于从 CPU 缓存未命中、上下文切换、锁竞争等微观视角定位并解决性能瓶颈。 ● 业务驱动与沟通协作：对 AI 大模型技术充满热情，不仅能交付高质量的系统级代码，更能与算法科学家、模型训练专家进行深度技术对话，将模型侧的痛点精准转化为底层存储的工程解法。

面向芯片软件Agent研发-阿里星-阿里巴巴2027届实习生

薪资面议

成都/上海/杭州/北京

本科

展开

芯片软件高性能 kernel 生成智能体研发 - 阿里星-阿里巴巴2027届实习生

薪资面议

成都/上海/杭州/北京

本科

展开

面向AI原生应用的安全智能体关键技术与算法研究-A Star-阿里巴巴2027届实习生

薪资面议

杭州/北京

本科

展开

算法工程师-大语言模型（代码研发 & 端侧模型）（T-Star Lab ）-阿里巴巴2027届实习生

薪资面议

杭州

本科

展开

3D重建大模型-阿里星-阿里巴巴2027届实习生

薪资面议

杭州

本科

展开

AI Infra硬件系统开发工程师-阿里巴巴2027届实习生

薪资面议

杭州/深圳

本科

展开

岗位职责

AI Infra硬件系统开发工程师，既是底层硬件架构的设计者与实现者，也是连接算法需求与物理算力的核心桥梁。通过深度协同软硬件、定义高性能高能效的AI计算系统，推动阿里云AI基础设施的技术突破，为大模型训练与推理提供世界级的硬件支撑，赋能千行百业的智能化升级。 1. 硬件产品设计 • 负责服务器/HBA卡/加速模块/网卡/SSD/传输板卡/光模块等产品硬件模块硬件方案设计，完成单板原理图，PCB设计； • 负责产品硬件实现，协同结构、散热、工艺、SI、电源等工程领域，完成产品硬件设计、器件选型、调测环境搭建、问题分析解决、设计文档编写、生产导入、改进和维护等工作； • 负责自研或定制化芯片硬件工程可实现性方案设计及验证，为芯片产品化应用扫清障碍； 2. 功能调试 • 完成单板功能调试、可靠性测试、专业试验，测试Bug解决等相关工作； • 配合BIOS/BMC FW/OS等软件工程师进行系统功能调试及解决问题； 3. 产品维护 • 负责硬件产品全生命周期的硬件维护，包含生产及现网的问题解决及优化； • 负责硬件工程领域前沿技术研究，持续优化及突破硬件工程领域的基线能力； 4. 项目管理 • 按项目计划进行产品硬件落地实施，并对项目硬件进度、数据、质量进行监控，确保项目保质保量实施； • 总结项目经验和教训，反馈项目成果，为之后的产品开发沉淀经验总结。

岗位要求

1. 技术基础扎实 • 掌握电路理论、数字/模拟电子技术、计算机组成原理等基础知识； • 掌握信号完整性，电源完整性理论基础，对各类电子元器件的功能及应用有了解，在产品应用中的注意事项有基本认知； • 了解服务器、交换机产品硬件架构，熟悉CPU、内存、I/O子系统及常用总线协议； 2. 实践能力突出 • 熟悉至少一种主流EDA工具（如Cadence Allegro、OrCAD、Mentor等）； • 具备示波器、逻辑分析仪、网络分析仪等硬件调试设备使用经验者优先； • 有FPGA开发、单片机及嵌入式系统、PCB设计或电子竞赛项目经验者优先； 3. 软硬协同意识强 • 了解Linux基础、Shell/Python脚本，有自动化测试脚本开发经验者优先，能配合软件团队进行底层联调； 4. 有良好的技术热情和积极的学习意愿 • 具备快速学习能力、肯钻研，具有系统思维和解决复杂问题的热情； • 英语良好，能阅读英文芯片手册、技术规范及行业白皮书； • 对AI、云计算、数据中心基础设施有浓厚兴趣，关注技术前沿。加分项： 1.有参与AI集群、智算服务器或异构计算系统相关项目经历，了解AI加速器（如GPU/TPU/NPU）、高速互联（如NVLink/RoCE）或能效管理等关键技术者优先； 2.有AI应用或Agent实际落地经验：能利用AI agent提升硬件学习/开发/问题处理效率等，有可展示的项目/实习成果者优先。

AI Infra研发工程师-广告引擎-阿里巴巴2027届实习生

薪资面议

北京

本科

展开

岗位职责

我们在做什么 ● 在AI与广告技术融合的最前沿，我们正在打造世界领先的AI广告系统，用技术驱动千亿级商业决策。每一行代码都将释放巨大商业价值！你将参与的核心项目 AI 训推 Infra 优化建设 ● 从稀疏传统广告模型到稠密计算大模型，从端到端训练到大模型微调，持续优化改造工业级模型训练框架。 ● 从GPU到PPU到AMD，针对高度复杂的异构计算资源和环境，优化构建万卡推理引擎，支持广告全链路大模型提效。云原生架构赋能 ● 践行DevOps、ServiceMesh、Serverless-GaaS、落地AI运维、科学实验，为广告系统提供强大的基础设施。 ● 运用容器化、微服务构建弹性高可用的广告平台，管控海量广告引擎在离线资源和模型训推资源。用 AI 重塑研发 ● 基于LLM和Agent构建高质量知识库，高效管理数据、代码、系统、文档知识，让AI成为你最靠谱的技术伙伴。 ● 从需求理解、方案设计、代码编写、测试验证，到生产发布、日常答疑、问题诊断，端到端实现AI研发赋能。极致性能建模 ● 运用现代C++技术、CUDA等异构硬件编程技术，结合各种先进设施，构建毫秒级响应的分布式计算引擎。 ● 在训推之外，探索GPU/PPU异构硬件在广告引擎各场景的优化落地，帮助业务提升RT/建模Scalingup空间。业务赋能前沿 ● 参与广告产品 Agent重塑、AI·Targeting等重大升级，帮助AIGA/AIGB/AIGC/LUM/MUSE 等算法落地，助力AI提升广告效果。 ● 从容应对海量流量峰值，大促日常化不是梦！加入我们这里有开放、创新、追求卓越的团队文化和发展土壤: ● 你将与行业顶尖工程师并肩作战, 共同成长 ● 用技术改变商业世界，让AI赋能每一个决策期待与你一起，在阿里妈妈创造属于我们的技术传奇！

岗位要求

我们期待这样的你 ● 本科及以上学历，计算机、软件工程、人工智能等计算机相关专业。 ● 热爱编程，熟练掌握C/C++、Python 等编程语言，具备扎实的编程功底。掌握常用数据结构与算法，熟悉网络编程、多线程编程。 ● 熟悉CUDA编程，了解Tensorflow、PyTorch等机器学习平台，熟悉XLA/TensorRT/TVM 等机器学习编译器。 ● 了解DNN/LLM模型原理、工程架构，熟悉CPU/GPU/XPU硬件原理，能够参与定制化的模型算子改造、训推优化。 ● 学习能力强，不畏挑战，喜欢钻研，善于独立思考并反思总结，有良好的沟通表达能力。加分项 ● 有大型项目开发经验或ACM/ICPC等算法竞赛经验 ● 有 AI Agent 开发 or AI 应用落地，有异构计算优化经验者 ● 权威竞赛获奖者或顶级会议论文发表者

国际体验运营-小语种-阿里巴巴2027届实习生

薪资面议

杭州

本科

展开

岗位职责

深入参与公司全球化战略的核心环节，协助负责特定国家市场（欧洲/拉美/日韩/中东等）的用户体验优化。如果你拥有出色的数理思维，逻辑脑和成长力。并对跨文化交流充满热情，这里将是你通往国际化运营的最佳起点。 1、数据驱动的体验洞察：通过体验链路核心数据指标洞察发现用户旅程中的异常点与机会点，结合用户的VOC原声定位具体卡点问题，结合国家用户的偏好及竞对视角，输出优化方案及数据化衡量监控指标，协同产品/技术等横向团队推动体验改善； 2、本地化运营支持与执行：对前台文案及服务方案进行系统走查，确保符合当地文化习俗，推进产品与内容的本地化机制或产品化方案的沉淀落地； 3、常规性收集并整理目标市场的竞品信息、政策法规及用户反馈，并基于个人兴趣与特长，独立承担一个小型的专项课题，并在实习期末进行汇报。

岗位要求

1、教育背景与经验：研究生学历，在跨境电商及咨询分析类岗位有实习经验者优先； 2、核心能力 ● 跨文化敏锐度：深刻理解目标国家的消费心理、风俗习惯、及社会禁忌，具备极强的文化适应性，有本地留学或生活背景者优先； ● 数据驱动思维：逻辑思维及框架性强，能通过数据发现体验断点并驱动改进，有基础SQL、Tableau 或类似数据分析经验者优先； ● 个人素质：善于沟通协作，具备的较好抗压能力和拥抱变化的心态，适应快节奏的国际化工作环境； 3、语言要求 ● 精通目标国家小语种者优先，可顺畅进行对消费者日常语境及工作场景商务语境沟通，满足主流专业等级认定证书及同等级别的评估，如日语N1/葡语C1/西语C1/波兰语C1/荷兰语C1/希伯来语B2或C1，英语专业8级/雅思7分； ● 小语种人才，如同时具备优秀英语工作能力者优先。

算法工程师-语音多模态（T-Star Lab）-阿里巴巴2027届实习生

薪资面议

杭州/北京

本科

展开

岗位职责

如果你，期望在阿里巴巴亿级用户生态中，定义下一代数字人的“灵魂”与“听觉”，打造具备极致情感表现力和深度理解能力的智能语音交互系统；如果你，期望探索高表现力语音合成的前沿，突破传统韵律限制，研发支持零样本音色克隆、多情感/多方言实时切换的语音生成技术，让数字人的声音不再冷冰冰，而是拥有细腻的情绪起伏和呼吸感；如果你，期望攻克语音多模态理解的核心挑战，不再局限于单一的文本转译，而是通过语音大模型直接从原始音频中建模情感、意图、环境与语气，实现对用户深层次语义和情绪的精准捕捉；如果你，期望挑战1v1全双工实时对话的技术难题，研发低延迟的端到端语音到语音生成架构，攻克打断机制、交互反馈等难题，让数字人具备如同真人般自然、流畅的对答体验；如果你，期望深入研究多模态对齐与融合，将语音特征与视觉表情、文本语义深度绑定，构建“音-意-形”高度统一的数字人交互大脑，解决业界在复杂对话环境下理解不准、响应过慢的技术痛点。加入我们，你的算法将赋能AI智能导购、虚拟主播等核心场景。让我们一起用语音连接智能，开启数字人交互的新纪元！研究背景：目前的数字人交互大多是“对讲机”模式（用户说完 -> 系统处理 -> 系统回答），存在明显的延迟和僵硬感。要实现真正的1v1自然对话，需要数字人具备实时监听、情感对齐和即时反馈的能力。研究课题： 1、流式情感感知：研究如何在用户说话过程中，实时通过流式音频提取情绪、语气和意图，而非等待整句话结束； 2、打断（Barge-in）与反馈机制：研发鲁棒的打断检测算法，并让数字人学会自发性口语，提升交互真实感； 3、预测性生成：探索如何根据用户已说出的前半句内容，提前初始化 TTS 渲染状态，实现“边听边想边说”的流式效果。成长支持&成长空间： 1、亲手参与从 0 到 1 定义数字人实时交互标准，体验技术改变数亿人购物方式的成就感； 2、算力自由：远离“算力焦虑”，专注于算法创新； 3、海量高质数据：拥有业界独有的、极其丰富的多模态商业场景数据，为研究零样本学习、多模态对齐等前沿课题提供土壤； 4、鼓励顶会产出：团队在保持业务领先的同时，高度重视学术沉淀。鼓励将研究成果总结并发表至ICASSP、NeurIPS 等顶会，支持参加国际学术会议，提升行业影响力。

岗位要求

1、计算机、信号处理、人工智能、语言学等相关专业，毕业时间在2026年11月以后的硕士及以上学历在校生； 2、熟悉常见的TTS架构，对韵律建模、音色克隆、情感控制有深刻理解； 3、熟悉主流 ASR 架构及语义理解算法，有 Speech-LLM研发背景； 4、熟悉 VAD、音频降噪、回声消除等前端技术，对全双工交互、流式语音处理有实践经验； 5、具备良好的工程与架构能力：精通 Python 编程及 PyTorch / TensorFlow 框架，具备优秀的算法实现能力，能够复现顶尖会议（ICASSP, InterSpeech, NeurIPS 等）的最新研究成果； 6、具备前沿视野：关注 Large Audio Models 或 Speech-to-Speech 的最新进展，对构建多模态统一大模型有强烈兴趣和独特见解。

算法工程师-3D重建大模型（T-Star Lab）-阿里巴巴2027届实习生

薪资面议

杭州

本科

展开

CIPU芯片研发工程师-阿里巴巴2027届实习生

薪资面议

杭州/北京

本科

展开

岗位职责

CIPU芯片是阿里巴巴云计算数据中心的“神经中枢”，通过硬件级卸载与加速云计算核心负载，将通用计算、AI计算、存储与网络资源深度融合，为云上应用提供极致性能与弹性扩展能力。作为连接云端业务需求与底层硅片实现的战略枢纽，你将主导下一代CIPU芯片的架构演进与产品落地，以自研芯片重新定义云时代的算力范式。在这里，你的每一行代码、每一次架构决策，都将直接转化为支撑全球百万级云服务器高效运转的硬核动力。 1. 架构规划与规格定义 • 深入洞察云计算与AI业务发展趋势，精准提炼芯片核心诉求，参与CIPU芯片规格定义与系统架构设计； • 主导芯片软硬件接口规范制定，完成系统级建模与接口适配，构建高效协同的交互框架。 2. RTL设计与高质量交付 • 负责核心算法与关键模块的RTL设计、编码实现与功能验证； • 运用先进设计方法论，确保模块在性能、功耗、面积（PPA）等多维指标上达到最优平衡； • 深度参与SoC集成与芯片全流程开发，保障设计高质量按期交付。 3. 系统验证与流片保障 • 采用业界先进验证方法学，制定系统化验证策略及各层级验证计划； • 搭建多层次验证环境与仿真平台，建立完善的验证闭环体系，为芯片一次流片成功保驾护航。

岗位要求

1. 扎实的ASIC芯片设计功底 • 精通数字电路设计原理，熟练掌握RTL编码规范与综合优化技巧； • 精通Verilog/SystemVerilog，具备复杂逻辑模块独立设计与实现能力； • 熟悉主流EDA工具链（VCS/Xcelium/Questa、Verdi、SpyGlass、Design Compiler、PrimeTime等），具备Debug复杂仿真波形、定位深层设计缺陷的能力。 2. 卓越的验证工程能力 • 熟练掌握SV/UVM验证方法学及Constrained-Random验证思想，具备搭建可重用验证环境的能力； • 熟悉功能覆盖率与代码覆盖率驱动验证（CDV），能制定科学的验证计划并实现验证目标闭环； • 熟悉常见SoC协议（如AMBA、PCIe/CXL、Ethernet、DDR等），有协议VIP使用或开发经验者优先。 3. 敏锐的业务洞察与架构思维 • 了解云计算基础设施架构，对存储、网络、安全或AI加速等至少一个领域有深入理解； • 具备系统级抽象能力，能将业务需求精准转化为芯片架构特性； • 对Chiplet、先进封装、异构集成等前沿技术保持关注。 4. 出色的协作能力与自驱力 • 具备优秀的跨团队沟通能力，能在复杂项目中高效推进多方协同； • 对芯片研发充满热情，具备强烈的技术好奇心与持续学习意愿； • 英语读写流畅，能无障碍阅读国际顶会论文、芯片手册及技术标准。 AI能力要求： 1. 掌握核心概念：了解机器学习、深度学习、强化学习的基本原理，对AI在EDA工具中的应用、Agentic-AI工作流等核心概念有基本认知； 2. 拥抱AI变革：对AI技术重塑芯片设计流程保持高度敏感，主动探索AI在提升设计效率、验证效率、覆盖率及缺陷挖掘方面的潜力，愿意尝试“AI+验证”的新范式； 3. 探索人机协同：能快速上手并熟练运用AI辅助工具提升RTL设计与验证效率，乐于探索人机协同解决复杂验证难题的创新模式；加分项: 1. 有CIPU/DPU/IPU、智能网卡、PCIe/Ethernet/DDR控制器或AI加速芯片相关研发经验者优先； 2. 熟悉RISC-V/ARM架构，或有处理器核设计、SoC集成经验者优先； 3. 具备芯片流片成功经验，完整经历过从架构定义到量产落地的全生命周期； 4. 有AI Agent辅助芯片设计/验证经验，或能利用大模型提升研发效能者优先； 5. 熟悉形式验证（Formal Verification）技术，能针对关键控制路径或安全敏感模块开展等价性检查与属性验证者优先； 6. 在DAC、DVCon等顶级会议或期刊发表过论文者优先。