AI可靠性工程实习生

280-300元/天
测试开发
北京
本科
4天/周
最少3个月
岗位关键词
岗位职责
**AI 推理系统的可靠性工程** - 设计并开发自动化验证框架,覆盖从 PyTorch 模型加载、ComfyUI 工作流执行到 HTTP API 返回的全链路 - 构建多维度质量基础设施:性能基准测试、GPU 兼容性矩阵、模型版本回归验证 - 开发诊断工具链,实现推理异常的可观测与快速定位(日志聚合、性能剖析、错误归因) **云原生 AI 服务的交付工程** - 设计 CI/CD 流水线中的自动化质量关卡:镜像预检、发布验证、线上健康巡检 - 参与开发 GitHub Actions 驱动的自动化测试平台 **新模型接入的工程化支持** - 与算法团队配合,将新模型/插件的手工验证流程转化为自动化测试套件 - 分析模型部署失败案例,构建常见故障模式的知识库与自动检测规则
岗位要求
## 我们希望你具备 - 扎实的编程能力,熟练使用 Python 进行工具开发 - 熟悉 Linux 环境与问题排查,能阅读错误日志并定位根因 - 了解深度学习基础:PyTorch 模块结构、模型加载机制、常见部署错误(CUDA 版本、依赖冲突等) - 不满足于执行测试用例,对"如何系统性地保障复杂软件质量"有好奇心 ## 加分项 - 有过 ComfyUI/Stable Diffusion WebUI 的本地部署或插件开发经验 - 了解容器化技术与云原生部署(Docker/Kubernetes) - 有过开源项目贡献或技术博客写作经历
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
北京硅基流动科技有限公司
企业服务
未融资
北京市
查看其他 2 个职位