卢先生
阿里巴巴集团·高级招聘经理
5分钟前
上次在线
---
反馈率
---
处理时长
在招职位 (457)
上海/杭州/北京
本科
岗位职责
AI 时代的到来为云计算的进一步发展提供了前所未有的广阔舞台,为云计算基础设施带来全新的机遇和挑战。加入我们一起打造 AI 时代持续领先的计算基础设施,依托阿里自研神龙虚拟化架构、CIPU处理器、灵骏智算、以及业界领先的云计算调度能力和容器化管理能力等,你将参与构建支撑亿级计算核心、十万卡级 GPU 集群的规模的 AI 计算基础设施。
我们致力于通过软硬件协同优化、虚拟化与容器化技术创新,解决模型训练、模型推理,Agent、超大规模资源调度全链路中的极致工程挑战。你的代码将直接运行在阿里核心的计算产品中——决定大模型分布式训练的通信效率、推理引擎的响应延迟、GPU 集群的资源利用率,以及百万级服务器的弹性调度与智能运维。加入我们,全球顶尖 AI 模型注入最强劲的算力引擎!
具体的职责包括以下相关方向的一项或多项:
1. 算力基建与分布式训练加速:
● 深入分布式训练架构,优化集合通信(AllReduce/AllGather)与底层算子性能,解决大规模集群通信瓶颈,提升模型训练的吞吐量与计算效率;参与研究新的训练框架和并行模式(DP/TP/PP/EP)。
● 针对大规模推理场景,研发高性能推理引擎,通过 Kernel 优化、KV Cache 管理、框架改进与算法协同优化等手段,实现极致的低延迟与高并发。
2. 高性能网络与通信基础设施:
● 研发面向 AI 超算的大规模高性能网络(200G/400G/800G)及通信基础设施, 优化降低分布式训练与推理的网络传输延迟。
● 负责 AI/高性能计算所需的高性能分布式通信框架研发,优化容器网络性能,保障海量任务的极致通信效率。
3. 加速计算与 GPU 集群管理:
● 持续探索前沿 GPU 架构设计与技术,结合业务需求构建高可用、高可靠、可扩展的加速计算技术体系。
● 构建加算计算算力统一管理系统,实现智算集群中 GPU 资源的全面监控、质量巡检、故障预测与性能水平标定(SLO),保障算力资源的稳定一致性。
4. 虚拟化与系统软件研发:
● 在 Intel/AMD/ARM 等新硬件平台进行 Hypervisor 关键特性研发,使能硬件加速能力(VT-x/EPT/SR-IOV),基于 DPU/CIPU 的加速与卸载方案研发,降低虚拟化性能开销。
● 负责云平台 CPU 调度器/内存管理系统/IO 资源虚拟化的设计研发与优化,提升资源利用效率与运维弹性,为Agentic AI提供可靠、高效、低成本的执行环境。
● 基于 TDX/SEV 等硬件安全能力,打造面向 AI 场景的机密计算解决方案,保护云上租户的模型与数据安全。
5. 容器化调度与编排优化:
● 深度优化 Kubernetes 调度器,实现面向 GPU 拓扑感知的算力分配,解决大规模分布式训练任务的资源碎片化问题。
● 研发面向 AI 推理与 Agent 运行的轻量化沙箱算力,实现计算资源的极致弹性与高密部署。
● 设计并实现面向 AI 工作负载的弹性调度策略,通过多级缓存、预加载等手段,实现 AI 任务与 Agent 的秒级快速拉起与自动伸缩。
6. 智能化集群管理与 AIOps:
● 构建超大规模基础设施的智能化集群管理系统,涵盖资源调度、监控报警、自动化运维等核心能力,实现算力资源的弹性分配与自动化运维闭环。
● 设计研发自主智能运维 Agent,通过自动故障感知、根因定位与自愈决策闭环,提升大规模集群的运维效率与稳定性。
7. AI 工程平台与效率提升:
● 打造一体化的 AI 研发平台,覆盖大模型训练、推理、调度的全流程,降低模型迭代门槛,提升研发效能。
● 探索 Serverless 等新场景下面向 AI 计算的解决方案,设计研发基于 AI 的智能应用弹性及资源弹性产品能力,推动端到端弹性伸缩优化。"
岗位要求
1. 基础条件:
● 计算机、软件工程、人工智能等相关专业优先。
● 热衷于数据结构和算法,在 ACM/ICPC 等竞赛中成绩优异者优先。
● 在系统、体系结构或 AI 领域顶会(如 OSDI, SOSP, ASPLOS, ISCA, MICRO, MLSys, SIGCOMM, NSDI 等)发表过论文,或在核心开源项目中有重大贡献(Maintainer/Committer)者优先考虑。
2. 专业能力(系统工程与计算底座):
● 系统编程功底:精通 C/C++、Go、Python 或 Rust 中至少一门语言,具备扎实的系统级编程能力。熟悉 Linux 内核(调度器、内存管理、网络栈、文件系统、cgroups)及高性能网络开发(Socket, RDMA, DPDK/SPDK),具备极强的底层工程实现与缺陷排查能力。
● 分布式系统与云原生:深刻理解分布式系统基本原理(如一致性、容错、扩展性等);对 Kubernetes 架构有一定理解,熟悉容器 Runtime(Docker/containerd/CRI)原理者优先;了解虚拟化技术(KVM/QEMU/Xen)或 DPU/智能网卡架构者加分。
3. AI 计算领域专业知识(满足其一即可):
● 了解 AI 的基本原理与常见算法,理解模型训练/推理任务的基本流程及其资源需求(如显存、带宽、通信模式),了解主流训练推理框架(如 PyTorch、Megatron-LM、DeepSpeed、vLLM、SGLang)的基本使用方式。
● 了解异构计算或高性能计算体系,熟悉 GPU 体系结构(PCIe/NVLink/NVSwitch)及相关编程模型(CUDA),有 GPU 相关优化经验者优先。
● 熟悉容器化环境下 AI 任务的架构及部署链路,了解如何通过容器/虚拟化技术优化模型加载、Checkpoint 保存、Memory 管理等环节。
● 了解 x86/ARM 体系结构,熟悉 CPU 虚拟化(VT-x)、内存虚拟化(EPT)、IO 虚拟化(SR-IOV/VFIO)等核心模块原理者优先。
4. 能力特质:
● 全局技术视野:具备跨域的技术视野,能从""GPU 算子 → HBM 显存 → NVLink/PCIe 总线 → RDMA 网卡 → 分布式调度器 → K8s 编排""的全链路视角拆解计算流程,准确把握计算、网络与调度的边界权衡。
● 系统思维与极致追求:乐于挑战复杂系统的性能极限,熟练使用各种 Profiling & Tracing 工具(如 eBPF、perf、ftrace、Nsight Systems、flamegraph),善于从 CPU 缓存未命中、上下文切换、锁竞争等微观视角定位并解决性能瓶颈。
● 业务驱动与跨域协同:对 AI 大模型技术充满热情,不仅能交付高质量的系统级代码,更能与算法科学家、模型训练专家进行深度技术对话,将模型侧的痛点精准转化为底层计算基础设施的工程解法。
● 极客精神:具备快速学习新技术的能力,渴望在高性能计算与大规模算力平台的交汇处实现技术突破;拒绝纸上谈兵,有自己独立完成的技术项目或开源贡献,展现极客精神。
【加分项】
● 在 GitHub 等开源社区有较大影响力的技术项目,作为 Collaborator/Committer/Member 优先;有 K8s/容器相关开源社区贡献(Kubernetes/KubeFlow/Volcano/OpenKruise 等)或 Linux 内核社区贡献者加分。
● 有高性能网络/RDMA 开发经验,或有 GPU 编程(CUDA)与性能优化实战经验。
● 有虚拟化/DPU/智能网卡开发经验,或有在离线混部、长尾延时优化等系统调优经验。
● 获得过业界有影响力的专利
申请
北京
本科
岗位职责
如果你,期望在阿里巴巴生态的广阔场景中,借助海量用户数据和先进的技术能力,打造千人千面的个性化数字人形象生产系统,为亿级用户提供高度定制化的虚拟形象服务;
如果你,期望攻克高保真语音驱动(Speech-to-Video)的核心难题,研发业界领先的唇形同步、情绪化面部表情及肢体动作生成算法,实现从音频到视频的端到端极致还原,赋予数字人如同真人般的自然表达力与情感共鸣;
如果你,期望挑战实时流式生成的技术难题,探索扩散模型与自回归模型的极速推理优化,实现低延迟、高吞吐的视频流实时产出,打破离线渲染的局限,支撑起百万级并发的实时交互直播场景;
如果你,期望突破数字人与物理世界的边界,深耕复杂物体交互(Human-Object Interaction)技术,解决数字人在手持商品、展示道具等动态交互过程中的物理规律约束、空间一致性及遮挡还原难题,让数字人在导购、演播等场景中具备真实的物体操控能力;
如果你,期望深入探索多模态统一大模型的应用,将视觉、语音、文本与动作序列深度融合,构建具备精细环境感知与逻辑理解能力的数字人系统,在复杂的电商实景中实现人-物-场的高度协同与自然对答。
加入我们,你的成果将直接应用于电商领域的核心场景——AI实时直播、智能客服、交互式数字导购,影响数以亿计的用户。在这里,你不仅是在写代码,更是在通过流式架构与交互算法,重新定义未来数字人的无限可能!
研究背景:在 AIGC 浪潮下,数字人已从早期的录像进化为动态实时生成。然而,业界仍面临三大核心挑战:
1、交互的自然度: 如何让数字人的肢体、表情与复杂的语音情感高度对齐,消除“恐怖谷”效应;
2、物理规律的缺失: 在电商直播等场景中,数字人需要手持商品、展示道具,如何解决手部交互(HOI)中的遮挡、形变及空间一致性是当前的技术深水区;
3、实时性的瓶颈: 扩散模型效果虽好但推理慢,如何实现低延迟的流式视频生成,是数字人从视频工具走向实时互动的必经之路。
研究课题:
1、基于扩散模型的高保真流式视频生成架构研究;
2、复杂场景下的人与物体交互(HOI)视频生成;
3、多模态情感驱动的全身动作与表情协同生成。
成长资源:
1、算力自由: 远离“算力焦虑”,专注于算法创新;
2、海量高质数据: 拥有业界独有的、极其丰富的多模态商业场景数据,为视频生成、HOI等前沿课题提供土壤;
3、鼓励顶会产出: 团队在保持业务领先的同时,高度重视学术沉淀。鼓励将研究成果总结并发表至CVPR、SIGGRAP、HNeurIPS 等顶会,支持参加国际学术会议,提升行业影响力;
4、工业界顶级专家的 1v1 指导: 团队由来自国内外顶尖院校的博士和工业界资深专家组成,实行“师兄制”,从学术论文投稿到工程落地全过程深度带教。
岗位要求
1、计算机/电子/人工智能/多媒体技术等相关专业,毕业时间在2026年11月以后得硕士及以上学历在校生;
2、 熟悉视频时序一致性处理、长视频生成、动作迁移或视频补全等技术;
3、精通 Python,熟悉 PyTorch / TensorFlow 等至少一种主流深度学习框架;
4、具备良好的代码习惯,能高效实现前沿论文算法,并进行复现与改进。
【加分项】
1、在相关领域国际会议发表有影响力的一作CCF-A论文;
2、作为主要参与者参与有业界影响力的技术工作。
申请
上海/杭州/北京
本科
岗位职责
在这里,你将成为大模型技术落地的"幕后推手"。你将参与构建支撑千卡/万卡规模的 AI 计算基础设施,通过软硬件协同优化,解决大模型在训练、推理、Agent 基础设施中的工程挑战。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率,为 AI 时代的算力底座注入核心动力。
具体的职责包括以下相关方向的一项或多项:
1. 面向 AI Infra 的操作系统:参与核心模块的设计与开发,包括 AI 训练、推理与 Agent 任务的资源调度、内存/显存管理、文件系统等底层系统的研发与优化。
2. 极致训练、推理与 Agent 软硬件协同优化:通过操作系统、Agent Sandbox、CUDA Runtime、KVCache 全栈优化 AI 工作负载 // 面向AI服务器优化,软硬件协同优化。
3. 工程效能提升与智能化:设计和实施系统级测试方案,包括单元测试、集成测试、性能测试和压力测试,保障系统稳定性和可靠性。
4. 运维监控系统建设:负责AI算力平台的日常运维、故障排查和性能监控,构建自动化运维工具和可观测性体系。
5. AI 可信计算体系建设:参与 AI Infra 以及 AI Agent 系统安全机制设计,包括资源隔离、权限控制、漏洞修复等,保障多租户环境下的系统安全技术探索。
6. 前沿 AIOS 技术探索:跟踪 AI Infra 前沿技术,探索 AI 与操作系统融合的创新方向,推动 AIOS 技术演进和开源社区贡献。
岗位要求
专业领域:
1. 计算机、软件工程、电子工程或相关专业。
2. 热衷于数据结构和算法、在ACM大赛成绩优异者优先;有顶会论文/高影响项目/开源贡献者加分。
3. 专业能力:
○ 系统工程与编程能力:具备良好的系统工程基础,熟悉 Linux 开发环境,掌握 Python、C/C++、Rust、Go 等至少一门编程语言,具备扎实的工程实现能力;
○ AIOS 系统领域专业知识:对于以下领域中的一项或者多项具备专业能力;
○ 了解 Linux 操作系统内核机制,具备扎实的系统级编程能力。有Linux内核开发、虚拟化技术、容器运行时、分布式系统或 AI 算力优化相关经验优先;
○ 了解 GPU 架构和 CUDA 编程,了解主流模型推理框架的运行机制。有 Pytorch、SGLang、vLLM、Mooncake 等开源项目经历优先;
○ 了解系统级测试方法和自动化测试框架。具备性能测试和压力测试实习经历的加分;
○ 了解系统监控和可观测性技术。熟悉 Prometheus、Grafana等监控工具;
○ 了解系统安全机制,包括资源隔离、权限控制、漏洞修复等。例如:了解操作系统安全机制,有 Confidential Containers 等开源项目经历;
○ 加分项:参与过开源操作系统项目、AI 基础设施项目或在系统顶会(OSDI/SOSP/ASPLOS)发表过论文。
AI 能力:
1. 问题解决:善于把复杂的系统工程挑战拆解为可优化的明确目标,判断哪些环节适合自动化、哪些需要人工干预和深度调优。
2. 批判性思考:对操作系统性能数据和 AI 工具的优化建议保持审慎,能识别瓶颈根源,不盲信表面指标,愿意深入底层验证和追问。
3. 学习判断力:对 AI Infra 和 OS 新技术有强烈好奇心,能快速上手并评估新工具、新框架对现有系统架构的真实价值。
4. 协作沉淀:能与多种角色围绕 AI 基础设施高效协同,善用 AI 编程工具提升效率,将个人实践转化为团队可复用的工具和流程。
申请
航空网络规划-阿里巴巴2027届实习生
薪资面议
杭州/深圳
本科
岗位职责
1. 负责航空干线网络的整体规划并为对应的规划结果指标负责;
2. 汇总并分析航空干线需求,从时效及成本等核心指标为切入点进行干线网络的规划和设计;
3. 通过规划方案的交付推动及指引航线相关的采购工作;
4. 监控并输出干线网络整体运营质量并推动优化方案的落地。
岗位要求
1. 英文可作为工作语言者优先;
2. 对于国际货代有一定兴趣;
3. 有过航空公司、货代的实习经验,对于航空物流有了解加分;
4. 优秀的领导力,喜欢独立思考,问题解决能力及执行力强,良好的沟通能力、分析能力和团队合作精神,结果导向;
5. 工作积极、主动、乐观、皮实;数据敏感度高并具备较好的数据分析能力。
申请
杭州/北京
本科
岗位职责
聚焦核心业务场景,利用Agent利用Agent等前沿技术推动AI在前端、客户端等全终端方向落地。你将参与从需求洞察到AI应用构建开发的全流程,推进AI应用的落地。
1.AI应用全端开发:—>AI应用全终端开发
● 负责AI在全终端方向的应用开发和优化。
● 参与AI终端和服务端的交互协议的设计、实现和优化。
2.AI应用基础组件开发:
● 负责AI应用全终端SDK的架构设计、开发和优化。
● 负责终端基础组件及架构设计, 推进研发效率;
3.性能优化:
● 负责优化前端、客户端等全终端SDK/App性能、体验优化及质量监控评估体系建设。
4.3D实时渲染:
● 负责利用AI能力,在终端实现2D/3D实时渲染技术的开发和优化。
岗位要求
1.基础条件
● 计算机、软件工程、人工智能等相关专业优先。
2.专业能力
● AI编程工具重度玩家:Cursor、Claude code等AI编程工具重度或顶级玩家,具备极强的Prompt编写与调优能力,有过完整的项目级开发经验,理解如何让AI写出生产级代码。
● 大模型能力理解与掌握:理解主流LLM的能力与局限,能够清晰拆解任务并通过LLM或确定性逻辑兜底实现;熟悉主流大模型的应用范式(Context Engineering、Prompt Engineering、Agent、工具/函数调用等等)及主流Agent框架(如LangChain等),具备大模型幻觉、Prompt注入等风险的工程化应对思路。
● 扎实的代码和工程能力:掌握扎实的编程基础,包括数据结构、算法、计算机网络、操作系统等基础知识;熟悉多种编程语言,至少精通一门,包括但不限于C/C++、JS、Java、Objective-C、Swift、TS等,熟悉多线程、内存管理、性能优化等核心机制。
● 跨平台开发能力:具备跨平台全终端开发能力,包括但不限于Web/iOS/Android/鸿蒙/Windows/MacOS/Linux//RTOS等; 具备良好的 Node.js开发能力。
3.能力特质
● 学习能力: 具备快速啃透前沿论文(Paper)的能力,并能将理论知识转化为工程代码。
● 开放性与动手能力: 拒绝纸上谈兵,有自己独立完成的小项目(开源项目或个人 Demo),展现极客精神。
● 好奇心与想象力: 面对未知事物有独特的想法,具备敏锐的问题定义能力和坚韧的解决问题能力。
● 审美追求: 技术亦有审美,鼓励你提出能提出打动人心、简洁优雅的好想法。
● 高能动性: 具备强烈的自驱力,能够主动探索边界,而不是等待被分配任务。
4.加分项
● 有AI应用或Agent实际落地经验:有全终端AI应用项目研发落地经验优先。
● 开源贡献或技术影响力:在Github上有高质量AI项目、技术博客或社区影响力。
申请
上海/北京
本科
岗位职责
1. 参与即时物流“AI智能决策”核心引擎的算法创新与落地,面向骑手规划排班、用户/骑手时间预估、骑手定价、骑手调度等即时物流核心场景,提升模型预估效果和决策精准度,持续提升用户和骑手体验;
2. 通过因果推断建模、运筹决策算法、出价/流量机制策略等技术创新,探索个性化、实时化、智能化的骑手排班、出价、调度系统,最大化即时物流效率;
3. 探索生成式、LLMxUplift、AI Agent智能决策等方向,推动前沿AI技术在即时物流核心场景的落地与应用。
岗位要求
1. 本科及以上学历,计算机科学/人工智能/运筹优化/数理统计等相关专业优先;
2. 具备扎实的编程基础(Python/C++/Java),熟悉常用算法与数据结构;
3. 熟悉TensorFlow/PyTorch等主流框架,具备良好的工程实现能力,能完成从算法设计到线上部署的全流程;
4. 有深度学习基础理论,具备优秀的逻辑思维、抽象建模能力和跨团队协作意识,能够在复杂业务中提炼技术问题并推动落地;
5. 对AI技术充满好奇心,主动关注大模型、运筹、强化学习、因果推断等领域前沿进展;
6. 在因果推断、广告出价、运筹优化、强化学习/在线学习、大模型等领域有实战经验者优先。
【加分项】
1. 在KDD、SIGIR、WWW、ICML、NeurIPS、RecSys等国际顶会发表过相关论文;
2. 在ACM、数学建模、天池、Kaggle等算法竞赛中取得优异成绩;
3. 有大规模在线广告、搜推系统、权益发放、用户增长等方向实习经历或大模型训练/微调经验(如Llama、GPT、多模态模型)相关项目经历。
申请
上海/杭州/北京/深圳
本科
岗位职责
1. 操作系统及内核研发:面向 Agent 工作负载的操作系统能力演进,推动内核子系统与上层系统组件的适配与创新,构建 Agent 与 OS 之间的交互接口与运行时基础设施。
2. 安全底座:构建 OS 级的 Agent 安全体系,在供应链安全、运行时安全隔离、OS 级行为审计与访问控制等方向建立纵深防御。
3. 智能化运维:探索 AI 与系统运维深度结合的模式,将操作系统运维知识封装为 Agent 可理解、可执行的能力,推动运维从人工经验驱动向智能化演进。
4. 可观测与效能优化:构建面向 Agent 行为的可观测体系,度量和优化 Agent 运行效能,从 OS 层系统性降低 Agent 运行成本。
5. 工程平台建设:构建面向操作系统研发场景的 Agent 基础设施平台,将各方向的 Agent 能力进行平台化沉淀,支撑 Agent 的规模化开发、运行与迭代。
岗位要求
专业领域:
1. 计算机科学、软件工程或相关专业。
2. 基础知识扎实,熟悉计算机体系结构、操作系统原理、网络、分布式系统、算法与数据结构等领域;在 ACM 大赛成绩优异者优先,有顶会论文/高影响项目/专利/开源贡献为加分项。
3. 专业能力:
● 系统工程与编程能力
○ 有扎实的系统工程基础,熟悉 Linux 开发环境,具备工程实现能力;
○ 扎实掌握 Python、C/C++、Rust、Go、Java 等编程语言中的一种或几种。
● 操作系统领域专业知识(对操作系统与基础软件有热情,对于以下领域中的一项或者多项有了解)
○ 了解 Linux 操作系统与发行版,具备扎实的系统级编程和优化能力。例如:有 Linux 内核开发、虚拟化技术、容器运行时、基础库等经验;
○ 了解计算机体系结构,可以为数据中心的软硬件基础设施进行操作系统级适配和协同优化。例如:有软硬件协同优化或芯片适配相关经历;
○ 了解系统安全机制,例如:软件供应链安全、系统权限控制与审计等;
○ 了解系统可观测技术、系统运维与性能优化方法,熟悉常见运维工具与性能调优手段,对 AI 驱动的智能化运维方向有兴趣。
● Agent 工程能力(对于以下领域中的一项或者多项有了解)
○ 了解 Agent 架构与工作流设计,能基于主流 LLM API 进行基本的 Agent 搭建与工程落地,了解 Agent Skill 的设计与封装方法。例如:有将
Agent 集成到实际系统或工具链中的项目经历;
○ 了解 AI 编程工具的实际应用,能基于自主代理执行工具构建面向操作系统场景的 Agent 任务。例如:有利用 Claw 类工具、AI 编程工具完成系统运维、内核调试、日志分析等实际任务的经历;
○ 了解 Agent 评测方法,关注 Agent 在系统级场景中的效果度量与质量保障。例如:有使用流行的 Agent 评测框架的经历。
AI 能力:
1. 问题解决:善于从复杂的操作系统与基础软件问题中识别适合构建 Agent 能力的环节,判断哪些场景用传统系统工程方案更可靠、哪些适合通过 Agent 来解决。
2. 批判性思考:对技术选型保持审慎,能评估端到端 Agent 方案在系统级场景下的真实可行性与安全边界,不为了用 AI 而用 AI。
3. 学习判断力:对新技术有强烈好奇心,能在操作系统与基础软件的传统能力和 Agent 技术栈之间建立连接,快速评估新工具的生产价值。
4. 协作沉淀:能与不同角色围绕 Agent 能力高效协同,善用 AI 编程工具提升多语言开发效率,将实践经验转化为团队可复用的工程方案。
申请
杭州
本科
岗位职责
在这里,你将成为大模型技术落地的“硬核引擎缔造者”。你将参与构建 AI Infra计算基础设施过程,通过软硬件协同优化技术,近距离与大模型设计者协同设计,通过网络计算融合、网络存储融合、异构计算加速等软硬件结合优化技术,让每一个GPU发挥出极致性能,让大模型在训练、推理、调度全链路中的表现出卓越性能。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率,为 AI 时代的算力底座注入核心动力。
1. 基于FPGA/ASIC芯片的设计与开发:
•负责FPGA/ASIC芯片的RTL设计与验证,包括C-Model、算法映射、硬件架构设计和性能调优;
•开发硬件抽象层(HAL)和相关工具链,支持硬件加速器与上层软件的无缝集成;
•参与硬件加速器及系统仿真模型的开发和调试。
2. 软硬件结合技术开发和优化:
•研发基于FPGA、ASIC等硬件的计算平台,实现高性能网络加速,网络与计算加速,网络与存储加速等开发优化,提升AI训练和推理等业务的计算性能;
•基于自研芯片,加速计算与计算之间,计算与存储之间,计算云服务之间的高性能,低延时互联,实现AI和通用计算的超节点高效互联。
3. 操作系统与固件开发:
•优化Linux内核、设备驱动和固件,发挥硬件的极致性能,提升硬件资源利用率;
•开发针对特定硬件的定制化操作系统模块,满足高性能计算、高性能网络需求。
岗位要求
1. 快速学习与创新能力:
•具备快速学习新技术的能力,能够不断突破软硬件结合领域的技术瓶颈;
•对前沿技术保持敏感,勇于探索未知领域,随时准备好迎接新挑战;
2. 扎实的软硬件基础:
•熟悉计算机体系结构、操作系统原理、网络协议和分布式系统;
•具备硬件设计经验(如FPGA、ASIC)或嵌入式开发经验,熟悉Verilog/VHDL等硬件描述语言;
3. 编程能力:
•精通至少一种编程语言(如C/C++、Python、Go),具备良好的代码风格和工程实践能力;
•熟悉底层开发(如驱动开发、固件开发)和高性能分布式并行计算开发,熟悉CUDA kernel开发;
4. 广阔的技术视野:
•在软硬件结合领域有实际项目经验,能够从系统层面分析和解决问题;
•熟悉云计算及相关产品,熟悉数据中心计算,存储,网络相关的技术;
•了解前沿的AI技术,对AI所需的硬件系统有比较好的了解;
5. 团队协作与沟通能力:
•具备良好的沟通能力和团队协作精神,能够在跨团队项目中高效合作;
•能够清晰表达技术方案,并推动复杂项目的落地实施。
加分项:
1. 有AI应用或Agent实际落地经验:包括不限于RAG系统、多智能体编排、结合MCP、Skill等的Agent项目,有可展示的项目/实习成果者优先。
2. 开源贡献或技术影响力:在Github上有高质量AI项目、技术博客或社区影响力。
3. 对AI Infra有基本理解:了解vLLM、Ollama等推理框架原理,理解延迟优化、KV cache优化、流式输出等工程全景视角。
申请
成都/上海/杭州/深圳/北京
本科
岗位职责
在这里,你将成为大模型时代算力底座的“核心引擎构造者”。依托阿里自研分布式存储系统与业界领先的计算网络架构,你将参与构建支撑千卡/万卡乃至十万卡规模的 AI 计算基础设施。
我们致力于通过软硬件协同优化、存算分离架构创新,解决大模型在预训练、微调、推理全链路中的极致工程挑战。你的代码将直接运行在阿里核心的 AI 存储产品中,决定千万级并发的数据加载吞吐、秒级 Checkpoint 的可靠性以及庞大 GPU 集群的 MFU(模型算力利用率)。加入我们,为全球顶尖 AI 模型注入最澎湃的数据动力!
具体的职责包括以下相关方向的一项或多项:
1. 面向 AI 计算的高性能存储系统研发:针对 AI 工作负载复杂且严苛的 I/O 特征(如海量小文件的高并发元数据检索、超大块数据的并行顺序流),进行内核态与协议栈级别的深度优化。主导研发基于 NVMe、RDMA/RoCEv2/eRDMA 的超低延时存储网络链路。
2. 极致性能的数据加载(Data Pipeline)与缓存加速:深度剖析大模型训练的数据读取链路,解决万卡集群下的 I/O 阻塞(I/O Bottleneck)与长尾延迟问题。研发面向大模型的分布式多级缓存与数据预取引擎,确保数据吞吐完全满足 GPU 显存带宽需求,实现计算与存储的完美 Overlap。
3. 云原生 AI 存储编排与智能化调度:结合 Kubernetes 生态构建云原生数据编排系统(如主导或参与 CNCF Fluid 等项目),将存储系统与计算调度平台深度集成。实现存算感知调度(Data-aware Scheduling)与弹性扩缩容,根据计算任务拓扑动态调整数据副本与亲和性策略,保障全网存储资源的极致效率。
4. Checkpointing 极致加速与容灾:针对超千亿/万亿参数模型的断点续传(Fault Tolerance)需求,设计高性能分布式持久化方案。通过内存-SSD-对象存储的分层拓扑、异步流式写入(Async I/O)、拓扑感知(Topology-aware)路由以及 GPUDirect Storage (GDS) 等技术,实现百 GB/TB 级模型权重的秒级保存与恢复,极大降低计算资源的闲置浪费。
5. 面向 Agent 使用场景的存储系统研发:通过分布式数据、元数据管理和高性能的分布式一致性协议等技术,支持海量 Agent 下的数据规模以及 IO 访问安全隔离、性能隔离。
岗位要求
1. 基础条件:
● 计算机、软件工程及相关专业。
● 热衷于数据结构和算法,在 ACM/ICPC 等大赛中成绩优异者优先。
● 在分布式系统、存储或操作系统领域顶会(如 FAST, OSDI, SOSP, SIGCOMM, NSDI 等)发表过一作论文,或在核心开源存储项目中有重大贡献(Maintainer/Committer)者优先考虑。
2. 专业能力(系统工程与分布式底座):
● 系统编程功底:精通 C/C++ 或 Go/Rust,具备扎实的系统级编程能力。熟悉 Linux 内核(VFS, Block Layer, Memory Management)及高性能网络开发(Socket, RDMA, DPDK/SPDK),具备极强的底层工程实现与缺陷排查能力。
● 分布式系统:深刻理解分布式系统理论(如 Paxos/Raft 一致性协议、分布式锁、纠删码 EC、数据分片与副本管理、分布式事务)。具备大规模分布式存储(如 HDFS, Pangu)的研发或深度调优经验。
3. AI 存储领域专业知识(满足其一即可):
● 深入理解 AI 训练与推理的 I/O 模式,熟练掌握底层数据加载机制(如 PyTorch Dataloader),熟悉 Megatron-LM, DeepSpeed, Ray, vLLM 等主流分布式训练/推理框架的存储诉求。
● 熟悉高性能存储协议及硬件架构,有 NVMe-oF, PCIe, CXL, GPUDirect Storage (GDS) 相关驱动开发与性能压测经验。
● 深刻理解云原生架构,有大规模 Kubernetes 集群下的存储 CSI、数据缓存编排调优经验。
4. 能力特质:
● 全局技术视野:具备跨域的技术视野,能从“GPU 寄存器 -> HBM 显存 -> PCIe 总线 -> eRDMA 网卡 -> 分布式磁盘”的全链路视角拆解数据流动,准确把握计算、网络与存储的边界权衡。
● 系统思维与极致追求:乐于挑战复杂系统的性能极限,熟练使用各种 Profiling & Tracing 工具(如 eBPF, perf, ftrace, Nsight Systems),善于从 CPU 缓存未命中、上下文切换、锁竞争等微观视角定位并解决性能瓶颈。
● 业务驱动与沟通协作:对 AI 大模型技术充满热情,不仅能交付高质量的系统级代码,更能与算法科学家、模型训练专家进行深度技术对话,将模型侧的痛点精准转化为底层存储的工程解法。
申请
成都/上海/杭州/北京
本科
岗位职责
围绕AI芯片软件研发场景,参与构建面向工程师的智能体(Agent)系统。你将基于大语言模型和Agent框架,将现有软件工具(测试框架、性能分析器、模型解析器等)封装为可调用的能力,并通过自然语言接口实现复杂研发任务的自动化编排与执行,提升芯片软件开发效率。
具体工作方向包括但不限于:
1.设计Agent与工程师的自然语言交互范式,准确理解研发意图
2.封装算子测试、性能建模、文档检索等领域工具,实现Agent对工具链的自主调用
3.构建Agent的推理与决策逻辑,处理多步骤任务(如“测试算子所有形状并简化失败用例”)
4.参与数据采集、流程优化与效果评估,形成可落地的智能体原型
岗位要求
1.计算机、电子工程、自动化等相关专业研究生在读。
2.扎实的Python编程能力,熟悉常用开发工具(Git、Docker等)
3.了解大语言模型基础,熟悉至少一种Agent框架(LangChain、LangGraph、AutoGen等)或有意愿快速学习
4.具备将复杂任务拆解为工具链调用序列的工程思维
5.对AI芯片或异构计算有一定了解者优先(如CUDA、TVM、MLIR、算子开发、性能分析)
6.良好的沟通与文档能力,能够清晰记录设计方案与实验结果
申请
成都/上海/杭州/北京
本科
岗位职责
参与高性能 DSL Kernel 智能体生成系统的研发和芯片 DSL 的设计工作,覆盖从语言抽象、代码生成到 AI Infra 集成的完整链路。
1.基于 LLM 与 Agent 框架,构建能够理解工程师需求并自动生成高性能 DSL Kernel 代码的智能体原型,覆盖任务拆解、工具调用与多轮推理等核心能力。
2.将需求理解、代码生成与验证反馈串联为可迭代的工作流,通过 Profiling 数据分析定位瓶颈,推动 Agent 系统在真实场景下的落地效果持续提升。
3.将生成的 Kernel 自动接入现有训练/推理框架,覆盖算子注册、显存管理、通信原语嵌入等工程环节,形成端到端的集成链路。
4.参与芯片 DSL 核心模块的设计与开发,抽象数据搬移以及计算通信语义,为上层 Kernel 编写提供更简洁、灵活的表达能力。
岗位要求
1.计算机科学、电子工程或相关专业硕士及以上学历;
2.扎实的 Python 编程能力,熟悉 Git、Docker 等常用工具;
3.了解大语言模型基础,熟悉至少一种Agent框架(LangChain、LangGraph、AutoGen等)或有意愿快速学习
4.对以下方向有了解者优先:领域专用语言(TileLang/Triton)、分布式通信、高性能计算。
申请
杭州/北京
本科
岗位职责
负责面向安全业务场景的大模型能力建设,包括但不限于以下方向:
1. AI for security,利用AI技术增强网络安全、数据保护和等领域的防御能力。在自动化威胁检测、分析和响应、DevSecOps等场景提升效率和攻防对抗能力。
2. Security for AI,保护AI应用系统安全,保护其免受攻击和滥用。
岗位要求
1. 有一定的科研经验,熟悉机器学习或安全领域,有扎实的理论基础和实践经验;
2. 具有较强的编程能力,熟练掌握 C/C++、Java、Python 等至少一门编程语言,能够对现有 SOTA 方法进行复现和测试;
3. 熟悉大模型相关技术栈,包括微调(PEFT、知识蒸馏等)、应用开发框架(LangChain、LangGraph、LlamaIndex 等)、推理部署(vLLM、SGLang 等),具备 CoT、Agent 等大模型应用形态的开发经验;
4. 了解安全攻防场景,对网络安全和大模型安全具有一定的了解;
5. 学习能力强,对前沿领域有强探索欲,有良好的逻辑分析能力和团队协作沟通能力。
加分项
1. 在校园内或互联网公司有相关实践经验,有高质量开源项目或落地项目产出者优先;
2. 在机器学习(NeurIPS/ICLR/ICML/CVPR/ICCV/ACL/KDD 等)或安全领域(S&P/CCS/NDSS/USENIX Security 等)的顶级会议或期刊上发表论文者优先;
3. 有 ACM、CTF、安全攻防、AI 安全等编程或安全类竞赛获奖者优先,红队社区贡献者优先;
4. 具备大模型攻防经验及大模型安全项目经验,或在强化学习对齐、推理增强、多模态大模型等前沿方向有研究或实践经验;
5. 有数理分析方面良好的素养以及数理统计基础者优先。
申请
展开
岗位职责
1、研发垂域大模型:面向淘宝复杂工程技术体系,构建懂淘宝上下文的研发垂域大模型
·设计面向复杂工程系统的大模型数据构建和训练策略,涵盖离线的研发数据的高质量组织与清洗、在线人机协同的用户轨迹数据组织与迭代、算法训练方式策略选择(CPT、SFT、RL/RLHF)等;
·攻克研发场景的大模型面临的工程系统关系理解、研发领域知识显式记忆与推理、研发域差异化任务规划及工具调用、及情景感知检索等方向难题,打造懂业务、懂架构的研发智能体能力。
2、端侧大模型探索:结合淘宝开源端侧深度推理引擎 MNN,探索极致高效的端侧大模型技术
·摒弃单纯的模型压缩思路,以端侧NPU/CPU/GPU 的硬件特性牵引大模型架构设计,探索并设计适合端侧运行的高效模型架构,在有限算力下突破性能瓶颈;
·负责端侧模型的全流程训练探索,涉及从预训练及后训练优化,结合投机采样、KV Cache优化、混合量化等优化,得到高性能的端侧大模型。
岗位要求
1. 计算机科学、人工智能、机器学习或相关领域专业、研究方向,毕业时间在26年11月以后的硕博在校生;
2. 在自然语言、LLM大模型、多模态大模型、大模型轻量化等相关领域的研究研发经验;
3. 具备出色的编程能力,熟练掌握Pytorch等深度学习框架和Python编程语言;
4. 敢于突破现状,勇于探索新思路、新技术,能够积极主动地进行协助沟通,配合团队共同完成目标。
【加分项】
在相关领域会议(如NeuIPS、ICML、ICLR、CVPR、ACL、AAAI、Interspeech、EMNLP、ICASSP等)发表过一作文章,有ACM竞赛获奖者优先。
申请
杭州
本科
岗位职责
1、物品3D大模型:聚焦淘宝商品的高还原度3D建模,产出比例结构、细节丰富度与实际物品具有高度一致性的3D模型
• 基于稀疏图片的3R建模技术,支持动态/静态场景,输出高精度位姿、点云、深度图、体素结构等信息;
• 设计3D VAE算法,构建高效3D数据表示(点云/网格/体素),实现3D数据的高效压缩,提升模型在几何重建、纹理生成和潜在空间控制方面的性能;
• 结合自回归(AutoRegressive)、强化学习(Reinforcement Learning)等技术,提高3D生成的精度、可控性和泛化性;
• 突破材质属性预测与生成技术,实现PBR材质预测、可控高清材质生成等,重点关注文字、纹理细节效果。
2、数字人3D大模型:打造高写实数字人,产出细节丰富(尤其是人脸)、可驱动的3D模型
• 3D数字人生成算法,结合3DGS的表征能力和DiT的生成能力,实现端到端生成细节丰富、分辨率>1024的高精度人体3D模型,同时透出人体姿态等信息;
• 3D数字人驱动技术,实现人体组件化、层次化拆解,实现自动化骨架绑定与蒙皮,确保驱动自然流畅。
岗位要求
1、毕业时间在 2026年11月及以后的在校硕博同学,计算机视觉、计算机图形学、机器学习等相关专业;
2、具备计算机图形学和计算机视觉理论基础;
3、具备极佳的工程实现能力,熟练掌握C++/Java/Python等至少一门语言;
4、敢于突破现状,勇于探索新思路、新技术,能够积极主动地进行协助沟通,配合团队共同完成目标;
5、在相关领域国际会议发表多篇论文或作为重要角色在权威比赛中取得优秀成绩优先。
申请
杭州/深圳
本科
岗位职责
AI Infra硬件系统开发工程师,既是底层硬件架构的设计者与实现者,也是连接算法需求与物理算力的核心桥梁。通过深度协同软硬件、定义高性能高能效的AI计算系统,推动阿里云AI基础设施的技术突破,为大模型训练与推理提供世界级的硬件支撑,赋能千行百业的智能化升级。
1. 硬件产品设计
• 负责服务器/HBA卡/加速模块/网卡/SSD/传输板卡/光模块等产品硬件模块硬件方案设计,完成单板原理图,PCB设计;
• 负责产品硬件实现,协同结构、散热、工艺、SI、电源等工程领域,完成产品硬件设计、器件选型、调测环境搭建、问题分析解决、设计文档编写、生产导入、改进和维护等工作;
• 负责自研或定制化芯片硬件工程可实现性方案设计及验证,为芯片产品化应用扫清障碍;
2. 功能调试
• 完成单板功能调试、可靠性测试、专业试验,测试Bug解决等相关工作;
• 配合BIOS/BMC FW/OS等软件工程师进行系统功能调试及解决问题;
3. 产品维护
• 负责硬件产品全生命周期的硬件维护,包含生产及现网的问题解决及优化;
• 负责硬件工程领域前沿技术研究,持续优化及突破硬件工程领域的基线能力;
4. 项目管理
• 按项目计划进行产品硬件落地实施,并对项目硬件进度、数据、质量进行监控,确保项目保质保量实施;
• 总结项目经验和教训,反馈项目成果,为之后的产品开发沉淀经验总结。
岗位要求
1. 技术基础扎实
• 掌握电路理论、数字/模拟电子技术、计算机组成原理等基础知识;
• 掌握信号完整性,电源完整性理论基础,对各类电子元器件的功能及应用有了解,在产品应用中的注意事项有基本认知;
• 了解服务器、交换机产品硬件架构,熟悉CPU、内存、I/O子系统及常用总线协议;
2. 实践能力突出
• 熟悉至少一种主流EDA工具(如Cadence Allegro、OrCAD、Mentor等);
• 具备示波器、逻辑分析仪、网络分析仪等硬件调试设备使用经验者优先;
• 有FPGA开发、单片机及嵌入式系统、PCB设计或电子竞赛项目经验者优先;
3. 软硬协同意识强
• 了解Linux基础、Shell/Python脚本,有自动化测试脚本开发经验者优先,能配合软件团队进行底层联调;
4. 有良好的技术热情和积极的学习意愿
• 具备快速学习能力、肯钻研,具有系统思维和解决复杂问题的热情;
• 英语良好,能阅读英文芯片手册、技术规范及行业白皮书;
• 对AI、云计算、数据中心基础设施有浓厚兴趣,关注技术前沿。
加分项:
1.有参与AI集群、智算服务器或异构计算系统相关项目经历,了解AI加速器(如GPU/TPU/NPU)、高速互联(如NVLink/RoCE)或能效管理等关键技术者优先;
2.有AI应用或Agent实际落地经验:能利用AI agent提升硬件学习/开发/问题处理效率等,有可展示的项目/实习成果者优先。
申请
北京
本科
岗位职责
我们在做什么
● 在AI与广告技术融合的最前沿,我们正在打造世界领先的AI广告系统,用技术驱动千亿级商业决策。每一行代码都将释放巨大商业价值!
你将参与的核心项目
AI 训推 Infra 优化建设
● 从稀疏传统广告模型 到 稠密计算大模型,从端到端训练 到 大模型微调,持续优化改造工业级模型训练框架。
● 从GPU到PPU到AMD,针对高度复杂的异构计算资源和环境,优化构建万卡推理引擎,支持广告全链路大模型提效。
云原生架构赋能
● 践行DevOps、ServiceMesh、Serverless-GaaS、落地AI运维、科学实验,为广告系统提供强大的基础设施。
● 运用容器化、微服务构建弹性高可用的广告平台,管控海量广告引擎在离线资源 和 模型训推资源。
用 AI 重塑研发
● 基于LLM和Agent构建高质量知识库,高效管理数据、代码、系统、文档知识,让AI成为你最靠谱的技术伙伴。
● 从 需求理解、方案设计、代码编写、测试验证,到 生产发布、日常答疑、问题诊断,端到端实现AI研发赋能。
极致性能建模
● 运用现代C++技术、CUDA等异构硬件编程技术,结合各种先进设施,构建毫秒级响应的分布式计算引擎。
● 在训推之外, 探索GPU/PPU异构硬件在广告引擎各场景的优化落地,帮助业务提升RT/建模Scalingup空间。
业务赋能前沿
● 参与广告产品 Agent重塑、AI·Targeting等 重大升级,帮助AIGA/AIGB/AIGC/LUM/MUSE 等算法落地,助力AI提升广告效果。
● 从容应对海量流量峰值,大促日常化不是梦!
加入我们
这里有开放、创新、追求卓越的团队文化 和 发展土壤:
● 你将与行业顶尖工程师并肩作战, 共同成长
● 用技术改变商业世界,让AI赋能每一个决策
期待与你一起,在阿里妈妈创造属于我们的技术传奇!
岗位要求
我们期待这样的你
● 本科及以上学历,计算机、软件工程、人工智能 等计算机相关专业。
● 热爱编程,熟练掌握C/C++、Python 等编程语言,具备扎实的编程功底。掌握常用数据结构与算法,熟悉 网络编程、多线程编程。
● 熟悉CUDA编程,了解Tensorflow、PyTorch等机器学习平台,熟悉XLA/TensorRT/TVM 等机器学习编译器。
● 了解DNN/LLM模型原理、工程架构,熟悉CPU/GPU/XPU硬件原理,能够参与定制化的模型算子改造、训推优化。
● 学习能力强,不畏挑战,喜欢钻研,善于独立思考并反思总结,有良好的沟通表达能力。
加分项
● 有大型项目开发经验或ACM/ICPC等算法竞赛经验
● 有 AI Agent 开发 or AI 应用落地,有异构计算优化经验者
● 权威竞赛获奖者或顶级会议论文发表者
申请
杭州
本科
岗位职责
深入参与公司全球化战略的核心环节,协助负责特定国家市场(欧洲/拉美/日韩/中东等)的用户体验优化。如果你拥有出色的数理思维,逻辑脑和成长力。并对跨文化交流充满热情,这里将是你通往国际化运营的最佳起点。
1、数据驱动的体验洞察:通过体验链路核心数据指标洞察发现用户旅程中的异常点与机会点,结合用户的VOC原声定位具体卡点问题,结合国家用户的偏好及竞对视角,输出优化方案及数据化衡量监控指标,协同产品/技术等横向团队推动体验改善;
2、本地化运营支持与执行:对前台文案及服务方案进行系统走查,确保符合当地文化习俗,推进产品与内容的本地化机制或产品化方案的沉淀落地;
3、常规性收集并整理目标市场的竞品信息、政策法规及用户反馈,并基于个人兴趣与特长,独立承担一个小型的专项课题,并在实习期末进行汇报。
岗位要求
1、教育背景与经验:研究生学历,在跨境电商及咨询分析类岗位有实习经验者优先;
2、核心能力
● 跨文化敏锐度:深刻理解目标国家的消费心理、风俗习惯、及社会禁忌,具备极强的文化适应性,有本地留学或生活背景者优先;
● 数据驱动思维:逻辑思维及框架性强,能通过数据发现体验断点并驱动改进,有基础SQL、Tableau 或类似数据分析经验者优先;
● 个人素质:善于沟通协作,具备的较好抗压能力和拥抱变化的心态,适应快节奏的国际化工作环境;
3、语言要求
● 精通目标国家小语种者优先,可顺畅进行对消费者日常语境及工作场景商务语境沟通,满足主流专业等级认定证书及同等级别的评估,如日语N1/葡语C1/西语C1/波兰语C1/荷兰语C1/希伯来语B2或C1,英语专业8级/雅思7分;
● 小语种人才,如同时具备优秀英语工作能力者优先。
申请
杭州/北京
本科
岗位职责
如果你,期望在阿里巴巴亿级用户生态中,定义下一代数字人的“灵魂”与“听觉”,打造具备极致情感表现力和深度理解能力的智能语音交互系统;
如果你,期望探索高表现力语音合成的前沿,突破传统韵律限制,研发支持零样本音色克隆、多情感/多方言实时切换的语音生成技术,让数字人的声音不再冷冰冰,而是拥有细腻的情绪起伏和呼吸感;
如果你,期望攻克语音多模态理解的核心挑战,不再局限于单一的文本转译,而是通过语音大模型直接从原始音频中建模情感、意图、环境与语气,实现对用户深层次语义和情绪的精准捕捉;
如果你,期望挑战1v1全双工实时对话的技术难题,研发低延迟的端到端语音到语音生成架构,攻克打断机制、交互反馈等难题,让数字人具备如同真人般自然、流畅的对答体验;
如果你,期望深入研究多模态对齐与融合,将语音特征与视觉表情、文本语义深度绑定,构建“音-意-形”高度统一的数字人交互大脑,解决业界在复杂对话环境下理解不准、响应过慢的技术痛点。
加入我们,你的算法将赋能AI智能导购、虚拟主播等核心场景。让我们一起用语音连接智能,开启数字人交互的新纪元!
研究背景:目前的数字人交互大多是“对讲机”模式(用户说完 -> 系统处理 -> 系统回答),存在明显的延迟和僵硬感。要实现真正的1v1自然对话,需要数字人具备实时监听、情感对齐和即时反馈的能力。
研究课题:
1、流式情感感知: 研究如何在用户说话过程中,实时通过流式音频提取情绪、语气和意图,而非等待整句话结束;
2、打断(Barge-in)与反馈机制: 研发鲁棒的打断检测算法,并让数字人学会自发性口语,提升交互真实感;
3、预测性生成: 探索如何根据用户已说出的前半句内容,提前初始化 TTS 渲染状态,实现“边听边想边说”的流式效果。
成长支持&成长空间:
1、亲手参与从 0 到 1 定义数字人实时交互标准,体验技术改变数亿人购物方式的成就感;
2、算力自由: 远离“算力焦虑”,专注于算法创新;
3、海量高质数据: 拥有业界独有的、极其丰富的多模态商业场景数据,为研究零样本学习、多模态对齐等前沿课题提供土壤;
4、鼓励顶会产出: 团队在保持业务领先的同时,高度重视学术沉淀。鼓励将研究成果总结并发表至ICASSP、NeurIPS 等顶会,支持参加国际学术会议,提升行业影响力。
岗位要求
1、计算机、信号处理、人工智能、语言学等相关专业,毕业时间在2026年11月以后的硕士及以上学历在校生;
2、 熟悉常见的TTS架构,对韵律建模、音色克隆、情感控制有深刻理解;
3、 熟悉主流 ASR 架构及语义理解算法,有 Speech-LLM研发背景;
4、 熟悉 VAD、音频降噪、回声消除等前端技术,对全双工交互、流式语音处理有实践经验;
5、具备良好的工程与架构能力: 精通 Python 编程及 PyTorch / TensorFlow 框架,具备优秀的算法实现能力,能够复现顶尖会议(ICASSP, InterSpeech, NeurIPS 等)的最新研究成果;
6、具备前沿视野: 关注 Large Audio Models 或 Speech-to-Speech 的最新进展,对构建多模态统一大模型有强烈兴趣和独特见解。
申请
杭州
本科
岗位职责
1、物品3D大模型:聚焦淘宝商品的高还原度3D建模,产出比例结构、细节丰富度与实际物品具有高度一致性的3D模型
• 基于稀疏图片的3R建模技术,支持动态/静态场景,输出高精度位姿、点云、深度图、体素结构等信息;
• 设计3D VAE算法,构建高效3D数据表示(点云/网格/体素),实现3D数据的高效压缩,提升模型在几何重建、纹理生成和潜在空间控制方面的性能;
• 结合自回归(AutoRegressive)、强化学习(Reinforcement Learning)等技术,提高3D生成的精度、可控性和泛化性;
• 突破材质属性预测与生成技术,实现PBR材质预测、可控高清材质生成等,重点关注文字、纹理细节效果。
2、数字人3D大模型:打造高写实数字人,产出细节丰富(尤其是人脸)、可驱动的3D模型
• 3D数字人生成算法,结合3DGS的表征能力和DiT的生成能力,实现端到端生成细节丰富、分辨率>1024的高精度人体3D模型,同时透出人体姿态等信息;
• 3D数字人驱动技术,实现人体组件化、层次化拆解,实现自动化骨架绑定与蒙皮,确保驱动自然流畅。
岗位要求
1、毕业时间在 2026年11月及以后的在校硕博同学,计算机视觉、计算机图形学、机器学习等相关专业;
2、具备计算机图形学和计算机视觉理论基础;
3、具备极佳的工程实现能力,熟练掌握C++/Java/Python等至少一门语言;
4、敢于突破现状,勇于探索新思路、新技术,能够积极主动地进行协助沟通,配合团队共同完成目标;
5、在相关领域国际会议发表多篇论文或作为重要角色在权威比赛中取得优秀成绩优先。
申请
杭州/北京
本科
岗位职责
CIPU芯片是阿里巴巴云计算数据中心的“神经中枢”,通过硬件级卸载与加速云计算核心负载,将通用计算、AI计算、存储与网络资源深度融合,为云上应用提供极致性能与弹性扩展能力。 作为连接云端业务需求与底层硅片实现的战略枢纽,你将主导下一代CIPU芯片的架构演进与产品落地,以自研芯片重新定义云时代的算力范式。在这里,你的每一行代码、每一次架构决策,都将直接转化为支撑全球百万级云服务器高效运转的硬核动力。
1. 架构规划与规格定义
• 深入洞察云计算与AI业务发展趋势,精准提炼芯片核心诉求,参与CIPU芯片规格定义与系统架构设计;
• 主导芯片软硬件接口规范制定,完成系统级建模与接口适配,构建高效协同的交互框架。
2. RTL设计与高质量交付
• 负责核心算法与关键模块的RTL设计、编码实现与功能验证;
• 运用先进设计方法论,确保模块在性能、功耗、面积(PPA)等多维指标上达到最优平衡;
• 深度参与SoC集成与芯片全流程开发,保障设计高质量按期交付。
3. 系统验证与流片保障
• 采用业界先进验证方法学,制定系统化验证策略及各层级验证计划;
• 搭建多层次验证环境与仿真平台,建立完善的验证闭环体系,为芯片一次流片成功保驾护航。
岗位要求
1. 扎实的ASIC芯片设计功底
• 精通数字电路设计原理,熟练掌握RTL编码规范与综合优化技巧;
• 精通Verilog/SystemVerilog,具备复杂逻辑模块独立设计与实现能力;
• 熟悉主流EDA工具链(VCS/Xcelium/Questa、Verdi、SpyGlass、Design Compiler、PrimeTime等),具备Debug复杂仿真波形、定位深层设计缺陷的能力。
2. 卓越的验证工程能力
• 熟练掌握SV/UVM验证方法学及Constrained-Random验证思想,具备搭建可重用验证环境的能力;
• 熟悉功能覆盖率与代码覆盖率驱动验证(CDV),能制定科学的验证计划并实现验证目标闭环;
• 熟悉常见SoC协议(如AMBA、PCIe/CXL、Ethernet、DDR等),有协议VIP使用或开发经验者优先。
3. 敏锐的业务洞察与架构思维
• 了解云计算基础设施架构,对存储、网络、安全或AI加速等至少一个领域有深入理解;
• 具备系统级抽象能力,能将业务需求精准转化为芯片架构特性;
• 对Chiplet、先进封装、异构集成等前沿技术保持关注。
4. 出色的协作能力与自驱力
• 具备优秀的跨团队沟通能力,能在复杂项目中高效推进多方协同;
• 对芯片研发充满热情,具备强烈的技术好奇心与持续学习意愿;
• 英语读写流畅,能无障碍阅读国际顶会论文、芯片手册及技术标准。
AI能力要求:
1. 掌握核心概念:了解机器学习、深度学习、强化学习的基本原理,对AI在EDA工具中的应用、Agentic-AI工作流等核心概念有基本认知;
2. 拥抱AI变革:对AI技术重塑芯片设计流程保持高度敏感,主动探索AI在提升设计效率、验证效率、覆盖率及缺陷挖掘方面的潜力,愿意尝试“AI+验证”的新范式;
3. 探索人机协同:能快速上手并熟练运用AI辅助工具提升RTL设计与验证效率,乐于探索人机协同解决复杂验证难题的创新模式;
加分项:
1. 有CIPU/DPU/IPU、智能网卡、PCIe/Ethernet/DDR控制器或AI加速芯片相关研发经验者优先;
2. 熟悉RISC-V/ARM架构,或有处理器核设计、SoC集成经验者优先;
3. 具备芯片流片成功经验,完整经历过从架构定义到量产落地的全生命周期;
4. 有AI Agent辅助芯片设计/验证经验,或能利用大模型提升研发效能者优先;
5. 熟悉形式验证(Formal Verification)技术,能针对关键控制路径或安全敏感模块开展等价性检查与属性验证者优先;
6. 在DAC、DVCon等顶级会议或期刊发表过论文者优先。
申请
阿里巴巴集团 电商 不需要融资 杭州市
阿里巴巴集团创立于 1999 年,业务覆盖电商、云计算、本地生活、物流、医疗、文娱、国际商业等全领域,全球员工规模庞大,是全球领先的互联网与科技企业。集团构建完善的技术体系与人才培养机制,推行轮岗、导师制与全球化项目机会,薪酬福利与职业发展体系行业领先。业务场景丰富,创新空间充足,应届生可从事技术研发、产品、运营、市场、战略等全品类岗位,在全球顶尖商业科技平台实现长期发展。