大模型推理性能优化算法工程师
40-100K * 20薪
算法工程师 北京 硕士 1-3年

岗位关键词
岗位职责
1、研发高性能推理算法: 设计并实现自注意力机制优化、并行推理、负载均衡、弹性容量等无损推理服务优化算法,提升服务效率与稳定性。
2、探索轻量化推理技术: 深入研究和应用有损推理加速算法,包括但不限于知识蒸馏、模型量化、网络剪枝、KV-Cache压缩等,实现模型的高效部署。
3、聚焦软硬件一体优化策略: 从计算图优化、算子融合、计算通信重叠、专家并行、vGPU虚拟化等多个维度入手,显著提升端到端推理性能。
岗位要求
1、教育背景: 计算机科学、人工智能或相关 STEM 领域硕士及以上学历,具备扎实的理论基础。
2、技术能力:
2a、优秀的基础: 拥有深厚的计算机科学理论根基与扎实的算法功底。
2b、编程实力: 具备卓越的编程能力和良好的工程实践习惯。
2c、引擎熟悉度: 熟练掌握 vLLM, SGLang, TensorRT-LLM 等主流大模型推理引擎之一,理解其核心原理。
3、经验优先:
3a、在自然语言处理、多模态大模型、扩散模型、图神经网络(GNN)等领域有研究、技术开发或实际落地经验。
3b、作为核心骨干在国际顶会(NeurIPS, ICML, ICLR,CVPR, ACL等)发表过高质量论文。
3c、在知名开源项目(如Hugging Face Transformers, DeepSpeed,vLLM,SGLang,TensorRT-LLM等)中有显著贡献。
3d、在权威人工智能相关竞赛(如Kaggle、天池)中获得优异名次。
4、软性素质:
4a、沟通协作: 具备出色的沟通表达能力和高效的团队协作精神。
4b、技术追求: 对技术有强烈的好奇心与钻研精神,追求卓越。
4c、解决问题: 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报