大模型/智能体/搜广推平台工程师

薪资面议
搜索算法
北京/上海/深圳
不限

投递时间:2025年7月28日-2025年11月30日(即将截止)

岗位职责
1、参与/负责研发面向大语言模型(LLM)/多模态大模型(MLLM)等类型模型的推理服务框架; 2、通过并行计算优化、分布式架构优化、异构调度等多种框架技术,打造高效、易用、领先的AI推理框架; 3、深度参与周边深度学习系统多个子方向的工作,包括但不限于模型管理、推理部署、日志/监控、工作流编排等; 4、与全公司各业务算法部门深度合作,为重点项目进行算法与系统的联合优化,支撑业务目标达成。
岗位要求
1、本科及以上学历,计算机等相关专业优先; 2、优秀的代码能力、数据结构和基础算法功底,熟悉C++开发; 3、熟悉至少一种主流的深度学习训练或推理框架(TensorFlow / PyTorch / Onnx / TensorRT等)的原理和实现; 4、具备AI模型性能调优、量化和稀疏化经验者优先; 5、有强烈的工作责任心,较好的学习能力、沟通能力和自驱力; 6、良好的沟通协作能力,能和团队一起探索新技术,推进技术进步。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
小红书
企业服务
D轮及以上
上海市
查看其他 1 个职位