推理优化工程师(扩散模型/生成式AI方向)-2026届校招
30-50K * 14薪
算法工程师 杭州 本科 2026届

岗位关键词
毕业要求:2026届
投递时间:2026年4月2日-2026年6月30日
岗位职责
1、针对扩散模型(如图像生成、视频生成、3D生成)的高性能推理引擎,支持多步采样、动态分辨率、多种调度算法等特性;
2、借鉴PagedAttention等思想,优化扩散模型中的KV Cache(或中间状态)管理,减少显存碎片和冗余存储。探索步数压缩(如LCM/LoRA)、模型剪枝等技术与推理的协同设计;
3、应用INT8/FP8/INT4等量化技术,在最小化画质损失前提下大幅提升推理速度;
4、基于K8S构建弹性的推理服务集群,实现动态批处理、自动扩缩容,提升GPU平均利用率。设计优雅的请求排队和负载均衡策略;
5、跟踪业界最新的推理加速技术,评估并引入新技术以持续优化生产环境成本结构和性能天花板。
岗位要求
1、精通Python和C++,具备优秀的代码优化和工程实现能力;
2、深入理解推理的全流程,熟悉常见优化技术。有丰富的ONNX/TensorRT/vLLM/TGI等推理引擎使用或二次开发经验;
3、对扩散模型的原理(前向/反向过程、去噪网络结构)有清晰认识,熟悉HuggingFace Diffusers库,并了解其性能瓶颈所在;
4、熟悉Docker/K8S等云原生技术,有模型服务的部署和调优经验,理解服务化指标(延迟、吞吐、SLO)。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报