深度学习推理优化工程师
薪资面议
深度学习 北京,上海 不限

投递时间:2025年7月28日-2025年11月30日(即将截止)
岗位职责
1、支持搜推业务场景高效接入模型推理服务,并通过算子融合、模型压缩、量化等手段优化现有模型推理性能;
2、支持CV/NLP内容理解场景高效接入模型推理服务,并通过算子融合、模型压缩、量化等手段降低推理成本;
3、对transformer、LLM等模型进行深度优化,满足性能和成本要求;
4、设计并实现高效的分布式离线推理方案,支持高效的离线批量模型推理。
岗位要求
1、本科及以上学历,计算机等相关专业优先;
2、熟练掌握C/C++,具有良好的工程能力、编程习惯、以及沟通能力;
3、熟悉pytorch/tensorflow等训练推理框架,掌握GPU 平台的高性能计算优化技巧;
4、深入了解Transformer、LLM 模型者优先考虑。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报