面向大规模llm infra的编译优化&代码生成与高性能算子优化-阿里星-阿里巴巴2027届实习生

薪资面议
C++
上海/杭州/北京
本科

投递时间:2026年4月24日-2027年4月24日

岗位职责
1、分析并优化NV/国产芯片大规模部署下主流模型(Deepseek、GLM、Kimi)性能,研究和优化关键算子性能,降低latency,提高MFU; 2、对LLM推理全链路效率有深入认知,探索并利用AI dsl能力推动关键链路的op fusion、meag kernel、auto-tuning&codegen、compute overlap,并能够独立在infra上验证or完成上线。
岗位要求
1、精通c++/python,熟悉llm推理框架(sglang/vllm)kernel开发&优化经验; 2、熟悉GPU架构,具备cuda/triton kernel开发&调优能力; 3、熟悉算子融合、量化等技术,对MOE, FlashAttention有比较深入了解和实际经验。 加分项: 1、有LLVM、Triton、tilelang相关经验,有编译优化、codegen相关经验; 2、有强烈技术热情和好奇心,自驱力和学习力强;具备良好的分析与解决问题的能力、沟通以及团队合作能力;喜欢挑战性的技术研发工作,善于攻坚克难,有创新热情,积极乐观,坚韧抗压,结果导向,能够持续推动问题的解决和突破。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 506 个职位