【阿里巴巴 2027 届应届生校园实习招聘】AI Infra 实习开发工程师

大家好,阿里云云原生部门 2026 届校招开始啦!面向2026.11 - 2027.10期间毕业的同学!直接内推到团队 leader,不会石沉大海;专人负责,定向跟踪。同学们快来投递~~

【我们是谁】
我们是阿里云 Serverless Agent Infra 团队,我们正致力于打造下一代高性能底座,以支撑智能体系统大规模、强隔离、高动态的负载挑战。团队依托在大规模弹性计算领域 10 年以上的深厚积淀,我们不仅是阿里巴巴大模型强化学习与智谱 z.ai 等超大规模 Agent 平台的坚实底座,更在国际顶尖学术会议持续输出系统创新成果。产品多年稳居 Gartner、Forrester 国际权威评测的领导者象限,代表了业界一流技术水准。我们相信 AI 应用的形态正由‘对话交互’演进为‘自主推理与执行’,这需要基础设施的同步进化。而 Serverless AI Infra 弹性 AI 算力,是 AI 应用落地千行百业的最合适、最具想象力的方向。团队氛围好,大牛超多,而且老板特别 nice。

【我们在做什么】
在工程上追求极限,在学术上探索未知。 我们不仅是在构建系统,更是在参与一场关于“计算范式”的革命。我们正围绕以下核心方向深耕:
1. 极致弹性运行时: 针对 Agent 负载高度不可预期的特性,我们通过深度定制的 MicroVM 、毫秒级休眠唤醒、Scale-to-Zero 等技术,让基础设施从容响应 Agent 的每一个指令。
2. 智能算力调度: 构筑异构资源的最优效能。利用数据智能驱动万级节点动态调度,通过软硬协同与网络深度优化,突破 GPU 供给瓶颈,在异构环境下提供极致的算力密度。
3. Agent 全生命周期管理: 定义 AI 原生应用的新架构。我们将 Serverless 的极简体验与 AI 应用架构的每个环节无缝衔接,打造从开发到演进的闭环平台,加速智能体在复杂业务场景中的规模化落地。

【我们的产品】
Agentrun: https://functionai.console.aliyun.com/welcome
函数计算 FC :https://fcnext.console.aliyun.com/overview
函数计算 FunArt: https://functionai.console.aliyun.com/funart/cn-hangzhou/explore

【我们在找】
 AI Infra 开发工程师
1. 构建极致弹性的 Agent 运行时: 深度参与下一代 Agent 运行时研发,攻克毫秒级冷启动、高密度 MicroVM 隔离及 Scale-to-Zero 等技术难题,确保基础设施能够平滑承接 Agent 瞬时爆发的动态负载。
2. 研发智能异构调度系统: 深度参与万级节点规模的资源调度优化,利用数据智能驱动 CPU/GPU 资源的最优分配,突破领域模型托管的性价比极限,在异构环境下打造业界领先的算力密度。
3. 构建 AI 原生应用平台: 建设 Agent 全生命周期管理平台,提供卓越的开发体验,驱动智能体应用在千行百业的规模化落地。
寻找优秀的你,与我们一起,在 AI 时代的星辰大海中携手同行。

【我们希望你是】
1. 算法/数据结构/操作系统等基础知识扎实,优秀的逻辑思维能力。
2. 至少掌握一门编程语言。例如Java/Go/C/C#/C++/Rust。
3. 积极拥抱 AI,了解提示词工程,Agent 等基础概念和相关技术。
4. 良好的沟通能力和团队合作精神,有一定的组织协调能力。
强烈加分项(满足一项即可):
5. 开源达人:是流行开源项目的贡献者,或者深入分析过流行开源项目的架构设计和实现。
6. AI实战派:在实验室课题或顶级科技公司实习中,有过大模型微调/强化学习、Agent 框架/应用开发等相关研发经验;
7. 学术大神:在计算机系统顶级会议(如 OSDI、SOSP 、Usenix等)发表过论文,或在 ACM/ICPC 等重磅程序设计竞赛中获得过优异成绩;

【工作地点】
北京/杭州/深圳

【投递方式】
简历命名格式:姓名-学校-岗位: 简历发送邮箱:baixu.mbx@alibaba-inc.com 
全部评论

相关推荐

发点面经攒攒人品1、你在线上或离线训练时,过拟合怎么处理?直接说你最有效的三个方法和拿到的收益。2、把 BN 讲透:原理是什么;训练期和推理期用的统计量有何不同;跟 LN、GN 比,分别什么时候用、怎么取舍。3、分类和回归你最常用哪些损失?你更偏好哪几个,为什么(从鲁棒性、梯度、数值稳定性上谈)。4、L1 和 L2 正则你怎么选?它们各自的效果与风险是什么,工程里你是怎么权衡的。5、二元和多分类的交叉熵你怎么写?在工程里你怎么做数值稳定实现。6、AUC 到底在统计上代表什么?你怎么计算它,在线上业务里你如何解释“这次 AUC 提升”的含义。7、你做 CTR/CVR/CTCVR 联合建模时,ESMM/ESMM2 是怎么推导与工程落地的?线上到底带来了什么收益。8、Transformer 里因果注意力的 Q/K/V 各从哪来?Mask 具体怎么实现。9、Scaled Dot‑Product Attention 为啥要除以 √dk?如果不除会出什么数值或训练问题。10、把 Transformer / Decoder‑only 的整体结构过一遍,各个组件分别在干什么,有哪些常见变体。11、位置编码这条线你怎么选:绝对 PE、相对 PE、RoPE 各自的思路、优势和局限,结合你的项目谈取舍。12、长上下文怎么搞?Rope scaling、Position Interpolation、KV Cache 管理、检索增强、窗口注意力,你的实战方案是什么。13、KV Cache 在训练和推理中的差异是什么?它的加速价值有多大,吞吐与延迟你是如何权衡的,vLLM/paged‑attention 需要注意什么。14、PEFT 方案里(LoRA/QLoRA/Prefix/Prompt‑Tuning/Adapter)你怎么选?说说稳定训练的经验。15、SFT 和对齐(RLHF/DPO/IPO/PPO)原理差在哪?在不同数据与资源条件下,你怎么选路线。16、RAG 系统你怎么设计?切分、索引、召回/重排、压缩/融合、兜底策略怎么串。17、提示词工程你是怎么搞的?System/角色/约束/分步指令怎么写,如何防越狱
查看17道真题和解析
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务