面向万亿参数大模型多层级kvcache存储系统研究-阿里星-阿里巴巴2027届实习生

薪资面议
后端工程师
北京
本科

投递时间:2026年4月24日-2027年4月24日

岗位职责
在阿里云操作系统实验室,你将负责下一代MoE大模型推理系统的架构设计与核心实现。主要工作围绕Prefill-Decode分离(PD Disaggregation)与Expert Parallelism(EP)的端到端协同,持续优化Mooncake的KVCache系统,支撑千问、灵骏、PAI等阿里云关键AI业务。主要职责是: 1、深入理解并改进Mooncake、SGLang等开源推理框架; 2、设计Mooncake KVCache分层、弹性伸缩、故障自愈等核心模块,追求毫秒级延迟与极致吞吐; 3、结合最新硬件与操作系统能力优化大模型推理系统; 4、撰写顶会论文(SOSP/OSDI等),将创新回馈开源社区。
岗位要求
1、计算机相关专业硕士及以上,博士优先; 2、精通C++/Python/CUDA; 3、熟悉分布式推理系统,理解KVCache、PD分离; 4、良好的英文读写与团队协作能力。 加分项: 1、在OSDI/SOSP等顶会发表过论文; 2、主导或核心贡献过vLLM、SGLang、Mooncake、Pytorch、Dynamo等开源项目; 3、熟悉Kubernetes、Ray、KubeRay等云原生调度系统; 4、有GPU显存管理、KVCache、RDMA网络栈优化实战经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
阿里巴巴集团
电商
不需要融资
杭州市
查看其他 499 个职位