AI Infra数据系统实习【杭州深圳上海北京南京西安】
300-1000元/天
大数据开发工程师 杭州 硕士 5天/周 最少3个月 有转正

岗位关键词
投递时间:2026年3月23日-2026年4月30日
岗位职责
1、参与语言、多模态与 Agent 场景下数据生产与流转体系的开发,构建高吞吐、可扩展的数据基础设施,优化数据采集、处理、存储与分发效率,支撑规模化模型训练与行业调优。
2、参与面向异构分布式环境的数据处理与调度系统的开发,实现分布式数据流水线与推理服务化架构,支持多模型推理、数据合成与蒸馏的高并发执行,提升资源利用率与整体吞吐。
3、参与统一数据格式与版本管理体系的实现,参与面向大规模训练与推理的存储架构开发,提升数据可追溯性与生命周期管理能力,支撑 PB 级数据规模扩展。
4、参与大模型数据工程平台与工具链能力的建设,包括任务编排、指标采集、失败恢复与自动扩缩容等模块的实现,推动数据生产与验证的自动化闭环,支撑数据飞轮高效运转。
5、跟踪分布式计算、存储与推理加速等前沿技术,与算法及平台团队协作,推动数据工程与训练系统、推理服务及 Agent 架构的融合落地,持续提升工程成熟度与技术竞争力。
岗位要求
1、计算机科学、软件工程、人工智能、计算机工程、机器学习、数据工程等相关专业,具备扎实的计算机系统基础。
2、具备较强的代码编写和算法实现能力,熟悉模型架构、数据工程、操作系统、分布式计算与存储系统、并行软件开发。
3、具备较强的学习能力、自驱意识、团队意识和责任意识,能够积极参与团队协作,快速适应技术迭代。
4、具备良好的工程实现能力,熟悉分布式计算与存储系统,有高性能数据处理与调度系统开发经验,或有推理服务化部署、集群性能优化经验者优先。
5、有相关实习经验或高水平竞赛(如 ACM、ICPC 等)获奖经历者优先;在领域顶级会议(如 NeurIPS、ICML、AAAI、VLDB 等)发表论文者更佳。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报