LLM推理优化-实习（可提供转正机会）

400-450元/天

算法工程师

硕士

3天/周

最少3个月

有转正

叶女士

英伟达半导体科技(上海)有限公司·hr

反馈率：5% | 反馈时长：1天

岗位关键词

投递时间：2025年9月17日-2026年7月31日

岗位职责

LLM inference • 大模型推理系统优化:通过系统手段来提升TensorRT-LLM的性能、易用性和功能丰富度。包括但不限于TensorRT-LLM的API改进、LLM runtime优化、服务层优化、定制优化算子、分布式优化等等。 • 大模型推理模型优化: 通过模型优化的手段进一步提升TensorRT-LLM的性能表现，包括低比特量化，KV Cache量化，稀疏化等等，也包括类似于Speculative decoding, Streaming-LLM这类模型系统联合优化的工作内容。 AI Complier System • AI编译器: 主要包括如何使用AI编译器技术，在NV的当代硬件，以及未来硬件上，以自动化的方式生成高效的计算密集/访存密集的算子kernel。

岗位要求

1、有大模型推理优化相关经验 2、可以实习3个月左右，一周至少出勤3天 3、提供转正机会

深圳南山区金地威新软件科技园北区南山区高新区高新南九道9号威新软件科技园8号楼5层

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

英伟达

硬件

已上市

北京上海深圳

查看其他 11 个职位

0 笔试题目 34 面试经验 0 面试短评