LLM推理优化-实习(可提供转正机会)

400-450元/天
算法工程师
北京
硕士
3天/周
最少3个月
有转正
岗位关键词

投递时间:2025年9月17日-2026年7月31日

岗位职责
LLM inference • 大模型推理系统优化:通过系统手段来提升TensorRT-LLM的性能、易用性和功能丰富度。包括但不限于TensorRT-LLM的API改进、LLM runtime优化、服务层优化、定制优化算子、分布式优化等等。 • 大模型推理模型优化: 通过模型优化的手段进一步提升TensorRT-LLM的性能表现,包括低比特量化,KV Cache量化,稀疏化等等,也包括类似于Speculative decoding, Streaming-LLM这类模型系统联合优化的工作内容。 AI Complier System • AI编译器: 主要包括如何使用AI编译器技术,在NV的当代硬件,以及未来硬件上,以自动化的方式生成高效的计算密集/访存密集的算子kernel。
岗位要求
1、有大模型推理优化相关经验 2、可以实习3个月左右,一周至少出勤3天 3、提供转正机会
深圳南山区金地威新软件科技园北区南山区高新区高新南九道9号威新软件科技园8号楼5层
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
英伟达
硬件
已上市
北京 上海 深圳
查看其他 11 个职位