推理优化工程师(扩散模型/生成式AI方向)-2026届校招

30-50K * 14薪
算法工程师
杭州
本科
2026届
岗位关键词

毕业要求:2026届

投递时间:2026年4月2日-2026年6月30日

岗位职责
1、针对扩散模型(如图像生成、视频生成、3D生成)的高性能推理引擎,支持多步采样、动态分辨率、多种调度算法等特性; 2、借鉴PagedAttention等思想,优化扩散模型中的KV Cache(或中间状态)管理,减少显存碎片和冗余存储。探索步数压缩(如LCM/LoRA)、模型剪枝等技术与推理的协同设计; 3、应用INT8/FP8/INT4等量化技术,在最小化画质损失前提下大幅提升推理速度; 4、基于K8S构建弹性的推理服务集群,实现动态批处理、自动扩缩容,提升GPU平均利用率。设计优雅的请求排队和负载均衡策略; 5、跟踪业界最新的推理加速技术,评估并引入新技术以持续优化生产环境成本结构和性能天花板。
岗位要求
1、精通Python和C++,具备优秀的代码优化和工程实现能力; 2、深入理解推理的全流程,熟悉常见优化技术。有丰富的ONNX/TensorRT/vLLM/TGI等推理引擎使用或二次开发经验; 3、对扩散模型的原理(前向/反向过程、去噪网络结构)有清晰认识,熟悉HuggingFace Diffusers库,并了解其性能瓶颈所在; 4、熟悉Docker/K8S等云原生技术,有模型服务的部署和调优经验,理解服务化指标(延迟、吞吐、SLO)。
拱墅区莱茵矩阵国际1号楼11层
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
群核科技
工具
D轮及以上
杭州,上海,成都,北京
查看其他 7 个职位