深度学习推理优化工程师

薪资面议
深度学习
北京,上海
不限

投递时间:2025年7月28日-2025年11月30日(即将截止)

岗位职责
1、支持搜推业务场景高效接入模型推理服务,并通过算子融合、模型压缩、量化等手段优化现有模型推理性能; 2、支持CV/NLP内容理解场景高效接入模型推理服务,并通过算子融合、模型压缩、量化等手段降低推理成本; 3、对transformer、LLM等模型进行深度优化,满足性能和成本要求; 4、设计并实现高效的分布式离线推理方案,支持高效的离线批量模型推理。
岗位要求
1、本科及以上学历,计算机等相关专业优先; 2、熟练掌握C/C++,具有良好的工程能力、编程习惯、以及沟通能力; 3、熟悉pytorch/tensorflow等训练推理框架,掌握GPU 平台的高性能计算优化技巧; 4、深入了解Transformer、LLM 模型者优先考虑。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
小红书
企业服务
D轮及以上
上海市
查看其他 1 个职位