【26届校招】-AI系统/编译工程师 - 大芯片(晶圆级架构)-前沿探索中心
薪资面议
研发工程师 上海 不限

投递时间:2025年11月27日-2029年3月18日
岗位职责
【团队愿景】
晶圆级架构是突破“后摩尔定律”算力瓶颈与打破工艺封锁的前沿关键路径。大芯片团队致力于打造面向 AGI 时代的超规格算力底座,AI 系统/编译团队负责构建使能该大芯片的AI软件栈与系统。
【岗位职责】
1. 参与面向晶圆级芯片的 AI Software Stack 研发:
2. 核心性能优化:深入理解硬件特性,负责算子生成、图算融合、显存优化或集合通信等关键环节的性能攻坚,挖掘硬件算力极限。
3. 前沿技术落地:负责大模型在新架构上的适配与加速,包括但不限于大模型推理(vLLM/SGLang)、分布式并行策略(3D Parallelism)或编译优化(Triton/MLIR)等技术的工程化落地。
4. 软硬协同设计:立足当前架构,实现算法与软硬件的深度协同(Co-design)与性能挖掘;与架构团队紧密配合,通过软件视角的反馈(如编程模型、IR设计)驱动下一代芯片架构的演进。
岗位要求
【职位要求】
1. 扎实的系统编程功底:精通 C/C++ 与 Python,拥有扎实的计算机体系结构功底(熟悉 GPU/NPU 架构、高性能计算、并行计算原理),具备系统软件开发能力。
2. 领域专长(满足其一即可,T型人才优先):
a. AI 编译方向:有开源AI编译系统(如Triton、XLA、TVM、MLIR等)经验,具备针对具体硬件的编译优化实践经历者优先,了解polyhedral model等先进优化技术者优先;
b. 高性能计算方向:精通 CUDA 或类似异构编程,熟悉 FlashAttention 等核心算子实现,有直接的CUDA或其他硬件加速优化经验优先;
c. AI 系统方向:理解大模型分布式训练原理(数据/模型/流水线并行),熟悉 Megatron-LM/DeepSpeed 等框架底层;理解 LLM 推理常见优化技术,熟悉 vLLM/SGLang 框架;
3. 极客精神与驱动力:对 AI Infra 技术有强烈热情,具备在非标准硬件平台上从 0 到 1 解决复杂问题的能力,能够快速迁移技术栈(如从通用 GPU 转向专用架构)。
【加分项】
1. 在 vLLM, PyTorch, Triton, TVM 等开源社区有贡献者(PR/Commit)。
2. 有自研 AI 芯片(如昇腾、寒武纪、沐曦、壁仞等)工具链开发经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报