AI Infra开发工程师【2026届春招】(J70238)
薪资面议
机器学习 北京 硕士

投递时间:2026年3月10日-2026年6月30日
岗位职责
1、负责公司模型基础设施的设计、开发、建设与落地,支撑各类AI模型的高效运行;
2、负责公司Agent Infra的搭建与迭代,优化Agent相关基础设施的性能与可用性,保障Agent生态稳定运行;
3、时刻关注模型基础设施、Agent Infra及相关系统的运行状态,参与平台值班,快速响应并处理各类运行异常,保障整体系统稳定可靠;
4、协助诊断线上系统故障,开展故障排查、性能优化工作,持续提升模型基础设施、Agent Infra的稳定性、响应效率与可扩展性;
5、参与AI Infra相关基础技术预研、工具验证,支撑团队技术选型,助力后续基础设施的迭代升级与技术创新。
岗位要求
1、硕士及以上学历,毕业时间:2025年9月-2026年8月,计算机、软件工程、人工智能、云计算或相关专业;
2、熟练掌握Go语言,具备清晰的代码结构、良好的编码习惯和严谨的逻辑思维;
3、熟悉常见的推理框架(如SGLang、Vllm),深入了解模型训练全流程,掌握常见的强化学习(RL)及模型微调框架;
4、熟练掌握Docker、Kubernetes等云原生技术,具备云原生环境下的开发与部署能力;
5、熟悉Linux环境开发与调试,具备基础的日志分析、异常排查及问题定位能力;
6、有在云厂商(如阿里云、腾讯云、华为云等)或AI平台相关项目的实习经历,熟悉其技术生态者优先;
7、具备良好的学习能力、沟通协作意识和强烈的责任心,有较强的团队融入能力和快速成长潜力。
加分项
1、有分布式推理相关项目或实习经历,具备分布式环境下模型部署与优化经验;
2、有云原生开发相关经验,熟悉Operator、Volcano等云原生工具的开发与应用;
3、有AI存储建设相关经验,了解AI场景下存储优化技巧者优先;
4、了解NCCL网络原理及应用,有相关技术实践经验者优先;
5、有实习或项目经历涉及机器学习平台、MLOps工具、调度系统或Agent相关领域;
6、熟悉Agent相关技术,包括Agent记忆机制、Agent开发、Skills封装,了解OpenClaw等相关工具者优先;
7、有使用AI工具的实践经历,能熟练运用工具提升开发效率;
8、在GitHub或开源社区有相关贡献(如ML、云计算、AI Infra方向)。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报