【快Star-X实习】多模态推理引擎工程师-北京

薪资面议
机器学习
北京
不限
0天/周
最少0个月
我公司正在参加 27届暑期实习专场 活动,更多适合你的职位内容,点击前往 活动大厅 查看->

投递时间:2026年3月25日-2026年6月30日

岗位职责
参与快手大模型推理引擎研发,工作内容包括: 1、参与大模型推理引擎的设计和研发,支撑快手自研以及开源模型的快速部署和高性能推理 2、通过各种技术手段持续优化性能,降低推理成本,包括但不限于:算子/编译优化、异构推理、模型量化&蒸馏、分布式并行等 3、支持RL中的多样化采样、generation性能优化等
岗位要求
1、有较强的学习能力和编程能力及数学基础 2、有开源大模型推理框架(vllm/slang/trt-llm)使用和优化经验者优先 3、有cuda或triton开发优化gpu算子经验者优先 4、有算力芯片优化经验者优先 5、有同领域相关实习经验者优先
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
快手
互联网
已上市
北京(总部)
查看其他 341 个职位