大模型推理性能优化算法工程师

40-100K * 20薪
算法工程师
北京
硕士
1-3年
岗位关键词
岗位职责
1、研发高性能推理算法:​​ 设计并实现自注意力机制优化、并行推理、负载均衡、弹性容量等无损推理服务优化算法,提升服务效率与稳定性。 2、探索轻量化推理技术:​​ 深入研究和应用有损推理加速算法,包括但不限于知识蒸馏、模型量化、网络剪枝、KV-Cache压缩等,实现模型的高效部署。 3、聚焦软硬件一体优化策略:​​ 从计算图优化、算子融合、计算通信重叠、专家并行、vGPU虚拟化等多个维度入手,显著提升端到端推理性能。
岗位要求
1、教育背景:​​ 计算机科学、人工智能或相关 ​STEM 领域硕士及以上学历,具备扎实的理论基础。 2、技术能力:​​ 2a、​优秀的基础:​​ 拥有深厚的计算机科学理论根基与扎实的算法功底。 2b、编程实力:​​ 具备卓越的编程能力和良好的工程实践习惯。 2c、引擎熟悉度:​​ 熟练掌握 vLLM, SGLang, TensorRT-LLM 等主流大模型推理引擎之一,理解其核心原理。 3、经验优先:​​ 3a、在自然语言处理、多模态大模型、扩散模型、图神经网络(GNN)等领域有研究、技术开发或实际落地经验。 3b、作为核心骨干在国际顶会(NeurIPS, ICML, ICLR,CVPR, ACL等)发表过高质量论文。 3c、在知名开源项目​(如Hugging Face Transformers, DeepSpeed,vLLM,SGLang,TensorRT-LLM等)中有显著贡献。 3d、在权威人工智能相关竞赛(如Kaggle、天池)中获得优异名次。 4、软性素质:​​ 4a、​沟通协作:​​ 具备出色的沟通表达能力和高效的团队协作精神。 4b、技术追求:​​ 对技术有强烈的好奇心与钻研精神,追求卓越。 4c、​解决问题:​​ 具备优秀的自驱力,能主动发现问题、分析问题并创造性地解决问题。
京东总部(亦庄)
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
京东
电商
已上市
北京,深圳,上海,西安,成都,南京,苏州,武汉,长沙,重庆
查看其他 59 个职位