微软STCA 大模型推理优化实习生招聘

250-400元/天
研发工程师
北京
硕士
4天/周
最少6个月
岗位关键词
岗位职责
- 利用算子优化,显存/KV cache管理优化、分布式加速等技术开发和改进推理框架; - 参与高并发场景下大模型推理的性能分析与优化工作,定位系统瓶颈并提出改进方案。 - 探索低资源下的大模型轻量化方案:量化、投机采样、sparse attention等技术; - 与团队协作,推动优化技术在业务中的应用。
岗位要求
- 计算机、人工智能、软件工程等相关专业硕士及以上; - 熟悉大模型推理优化方法,对主流开源推理框架tensorRT_llm、vllm、sglang 有开发经验者优先; - 精通 Python/C++ 编程,具有 CUDA 开发及 GPU 调优经验者优先; - 有顶会论文、竞赛获奖或相关实习经验者加分。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报