AI Infra软硬件结合开发工程师-阿里巴巴2027届实习生

薪资面议
C++
上海/杭州/深圳/北京
本科

投递时间:2026年4月24日-2027年4月24日

岗位职责
在这里,你将成为大模型技术落地的“硬核引擎缔造者”。你将参与构建 AI Infra计算基础设施过程,从GPU单卡到多卡、超节点、万卡集群,通过软硬件协同优化技术,近距离与大模型设计者协同设计,通过融合算子设计、多卡分布式并行、计算通信融合、计算存储融合、通信存储融合、异构计算加速等软硬件结合优化技术,让每一个GPU发挥出极致性能,让大模型在训练、推理、调度全链路中的表现出卓越性能。你的代码将直接决定大模型训练的效率、推理的响应速度以及集群资源的利用率,为 AI 时代的算力底座注入核心动力。 1、软硬件协同优化 •负责软硬件协同设计,优化计算性能、能耗效率和系统稳定性; •针对特定应用场景(如AI推理、分布式存储、实时计算等),设计并实现高效的软硬件解决方案。 2、基于FPGA/ASIC芯片的设计与开发 •参与FPGA/ASIC芯片的RTL设计与验证,包括C-Model、算法映射、硬件架构设计和性能调优; •开发硬件抽象层(HAL)和相关工具链,支持硬件加速器与上层软件的无缝集成; •参与硬件加速器及系统仿真模型的开发和调试。 3、计算平台软硬件结合技术开发和优化 •研发基于CPU、GPU、FPGA、ASIC等硬件的计算平台,实现计算加速、计算算子、融合算子等开发优化,提升AI训练和推理等业务的计算性能; •基于自研芯片服务器,实现超节点ScaleUp互连管控、分布式并行计算研发、多卡高效通信与加速,实现AI和通用计算的超节点高效运行。 4、操作系统与固件开发 •优化Linux内核、设备驱动和固件,提升硬件资源利用率和系统响应速度; •开发针对特定硬件的定制化操作系统模块,满足高性能计算需求。 5、开发者工具与生态建设 •开发软硬件结合的开发者工具链(如SDK、CLI、IDE插件),降低开发门槛; •构建开放的技术生态,推动软硬件一体化解决方案的广泛应用。
岗位要求
1、快速学习与创新能力 •具备快速学习新技术的能力,能够不断突破软硬件结合领域的技术瓶颈; •对前沿技术保持敏感,勇于探索未知领域,随时准备好迎接新挑战; 2、扎实的软硬件基础 •熟悉计算机体系结构、操作系统原理、网络协议和分布式系统; •具备硬件设计经验(如FPGA、ASIC)或嵌入式开发经验,熟悉Verilog/VHDL等硬件描述语言; 3、编程能力 •精通至少一种编程语言(如C/C++、Python、Go),具备良好的代码风格和工程实践能力; •熟悉底层开发(如驱动开发、固件开发)和高性能分布式并行计算开发,熟悉CUDA kernel开发; 4、广阔的技术视野 •在软硬件结合领域有实际项目经验,能够从系统层面分析和解决问题; •熟悉云计算及相关产品,熟悉数据中心计算,存储,网络相关的技术; •了解前沿的AI技术,对AI所需的硬件系统有比较好的了解; 5、团队协作与沟通能力 •具备良好的沟通能力和团队协作精神,能够在跨团队项目中高效合作; •能够清晰表达技术方案,并推动复杂项目的落地实施。 【加分项】 1.有AI应用或Agent实际落地经验:包括不限于RAG系统、多智能体编排、结合MCP、Skill等的Agent项目,有可展示的项目/实习成果者优先; 2.开源贡献或技术影响力:在Github上有高质量AI项目、技术博客或社区影响力; 3.对AI Infra有基本理解:了解vLLM、Ollama等推理框架原理,理解延迟优化、KV cache优化、流式输出等工程全景视角; 4.在 CV(计算机视觉)或 NLP(自然语言处理)方向有扎实的理论基础,有实际业务场景模型训练(SFT、RL)等经验的优先。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 506 个职位