大模型性能优化算法专家
研发类
上海
1人
不限经验
硕士研究生
职位详情
1、负责LLM和Diffusion Model的性能优化,基于TensorRT和模型量化剪枝等技术,以及CUDA算子融合重构等性能优化方案,结合业务需求将GPU性能发挥到极致;
2. 负责端云架构下的大模型整体推理优化算法方案研发,通过与算法效果团队深度合作实现云端和设备端算法模块与全系统架构的全面性能优化
要求
1、硕士及以上学历,计算机/电子/自动化/软件等相关专业,有AI大模型工程优化经验的优先;
2、精通C/C++ 及 Python,熟练掌握各类数据结构及相关基础算法;
3、精通GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
4、具备丰富的基于CUDA的GPU性能优化经验,同时具备设备端CPU/GPU推理加速经验更佳;
5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架和推理加速框架,包括Pytorch、TensorRT、TensorRT-LLM、VLLM等;
6、了解主流LLM、Diffusion Model,有LLM、Diffusion Model加速优化经验者优先。
【vivo内推】https://recruit.vivo.xyz/jobs/83479631ade32e1f14cb1bf4b8e4f07daee0f0079b060cafe8a5d0405ceac73c9448b2871f1ba14078ac464b7e1f0202b0419f2d02060c5f1d3cc7ee84c228f0,点击链接查看职位详情,欢迎加入vivo
研发类
上海
1人
不限经验
硕士研究生
职位详情
1、负责LLM和Diffusion Model的性能优化,基于TensorRT和模型量化剪枝等技术,以及CUDA算子融合重构等性能优化方案,结合业务需求将GPU性能发挥到极致;
2. 负责端云架构下的大模型整体推理优化算法方案研发,通过与算法效果团队深度合作实现云端和设备端算法模块与全系统架构的全面性能优化
要求
1、硕士及以上学历,计算机/电子/自动化/软件等相关专业,有AI大模型工程优化经验的优先;
2、精通C/C++ 及 Python,熟练掌握各类数据结构及相关基础算法;
3、精通GPU的高性能计算优化技术,深入理解计算机体系结构,熟悉并行计算优化、访存优化,低比特计算等;
4、具备丰富的基于CUDA的GPU性能优化经验,同时具备设备端CPU/GPU推理加速经验更佳;
5、了解深度学习算法基本原理,熟悉神经网络基本架构和各算子计算方式,了解至少一种深度学习训练框架和推理加速框架,包括Pytorch、TensorRT、TensorRT-LLM、VLLM等;
6、了解主流LLM、Diffusion Model,有LLM、Diffusion Model加速优化经验者优先。
【vivo内推】https://recruit.vivo.xyz/jobs/83479631ade32e1f14cb1bf4b8e4f07daee0f0079b060cafe8a5d0405ceac73c9448b2871f1ba14078ac464b7e1f0202b0419f2d02060c5f1d3cc7ee84c228f0,点击链接查看职位详情,欢迎加入vivo
全部评论
相关推荐

点赞 评论 收藏
分享