大模型训练框架实习生
300-500元/天
人工智能 上海 硕士 5天/周 最少3个月

岗位关键词
岗位职责
关于我们:
国内顶尖大模型创业公司,团队成员多来自清北复交浙新加坡国立大学,字节 TopSeed、DeepSeek、上海AI lab等,专注 AI 下半场的模型训练与 Agent 应用落地。 我们相信AI到了理解推理突破到能动性执行的奇点,致力于研究面向生产力的大模型技术。
岗位描述
紧密参与到训练框架的性能优化与日常开发,跟进业界技术进展,不断同步与集成最新训练优化策略。方向包括但不限于低精度,MoE,Hybrid/Sparse Attention,多模态模型训练等。
参与开发领先的RL Infra框架,提升最前沿的 RL 训练框架中的模型训练效率。
分析和定位线上训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性;
岗位要求
熟悉PyTorch深度学习框架;
熟悉Linux开发环境,熟悉Bash,C++和Python语言,精通分布式/多线程程序编程;
熟悉FSDP/Megatron等大规模训练框架,熟悉数据并行/模型并行/流水并行等常用分布式训练方案优先;
熟悉FP8/INT4等低精度训练技术者优先;
熟悉NV GPU高性能生态,有CUDA/Triton开发经验者优先;
熟悉RDMA高性能通信,有NCCL/NVSHMEM/Triton-distributed开发经验者优先;
每周可以实习4天及以上,可连续实习三个月以上。
具有复杂问题的分析和解决能力,有解决困难问题的自驱力与信心。
- 若具备以下经验将加分:
有算法背景,了解常见的大模型SFT/RL算法。
有开源经验,在mlsys相关背景的开源项目上贡献过代码。
实习信息
- 实习周期:3 个月起(可长期)
- 工作模式:线下(上海)
- 实习津贴:视能力与经验面议
- 提供:导师指导、真实项目机会、优秀者可转正
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报