【26届校招】-AI系统/编译工程师 - 大芯片（晶圆级架构）-前沿探索中心

薪资面议

研发工程师

不限

葛女士 3分钟前在线

上海人工智能创新中心·校招

反馈率：66% | 反馈时长：13天

投递时间：2025年11月27日-2029年3月18日

岗位职责

【团队愿景】晶圆级架构是突破“后摩尔定律”算力瓶颈与打破工艺封锁的前沿关键路径。大芯片团队致力于打造面向 AGI 时代的超规格算力底座，AI 系统/编译团队负责构建使能该大芯片的AI软件栈与系统。【岗位职责】 1. 参与面向晶圆级芯片的 AI Software Stack 研发： 2. 核心性能优化：深入理解硬件特性，负责算子生成、图算融合、显存优化或集合通信等关键环节的性能攻坚，挖掘硬件算力极限。 3. 前沿技术落地：负责大模型在新架构上的适配与加速，包括但不限于大模型推理（vLLM/SGLang）、分布式并行策略（3D Parallelism）或编译优化（Triton/MLIR）等技术的工程化落地。 4. 软硬协同设计：立足当前架构，实现算法与软硬件的深度协同（Co-design）与性能挖掘；与架构团队紧密配合，通过软件视角的反馈（如编程模型、IR设计）驱动下一代芯片架构的演进。

岗位要求

【职位要求】 1. 扎实的系统编程功底：精通 C/C++ 与 Python，拥有扎实的计算机体系结构功底（熟悉 GPU/NPU 架构、高性能计算、并行计算原理），具备系统软件开发能力。 2. 领域专长（满足其一即可，T型人才优先）： a. AI 编译方向：有开源AI编译系统（如Triton、XLA、TVM、MLIR等）经验，具备针对具体硬件的编译优化实践经历者优先，了解polyhedral model等先进优化技术者优先； b. 高性能计算方向：精通 CUDA 或类似异构编程，熟悉 FlashAttention 等核心算子实现，有直接的CUDA或其他硬件加速优化经验优先； c. AI 系统方向：理解大模型分布式训练原理（数据/模型/流水线并行），熟悉 Megatron-LM/DeepSpeed 等框架底层；理解 LLM 推理常见优化技术，熟悉 vLLM/SGLang 框架； 3. 极客精神与驱动力：对 AI Infra 技术有强烈热情，具备在非标准硬件平台上从 0 到 1 解决复杂问题的能力，能够快速迁移技术栈（如从通用 GPU 转向专用架构）。【加分项】 1. 在 vLLM, PyTorch, Triton, TVM 等开源社区有贡献者（PR/Commit）。 2. 有自研 AI 芯片（如昇腾、寒武纪、沐曦、壁仞等）工具链开发经验。

龙文路129号（国际传媒港L1大楼）

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

上海人工智能实验室

未融资

上海

查看其他 33 个职位

0 笔试题目 2 面试经验 0 面试短评