大模型训练框架实习生

300-500元/天

人工智能

硕士

5天/周

最少3个月

周女士昨日在线

上海奇绩智研智能科技有限公司·法人

反馈率：34% | 反馈时长：1天

岗位关键词

岗位职责

关于我们：国内顶尖大模型创业公司，团队成员多来自清北复交浙新加坡国立大学，字节 TopSeed、DeepSeek、上海AI lab等，专注 AI 下半场的模型训练与 Agent 应用落地。我们相信AI到了理解推理突破到能动性执行的奇点，致力于研究面向生产力的大模型技术。岗位描述紧密参与到训练框架的性能优化与日常开发，跟进业界技术进展，不断同步与集成最新训练优化策略。方向包括但不限于低精度，MoE，Hybrid/Sparse Attention，多模态模型训练等。参与开发领先的RL Infra框架，提升最前沿的 RL 训练框架中的模型训练效率。分析和定位线上训练中的性能瓶颈，实施针对性优化措施，提升训练效率和稳定性；

岗位要求

熟悉PyTorch深度学习框架；熟悉Linux开发环境，熟悉Bash，C++和Python语言，精通分布式/多线程程序编程；熟悉FSDP/Megatron等大规模训练框架，熟悉数据并行/模型并行/流水并行等常用分布式训练方案优先；熟悉FP8/INT4等低精度训练技术者优先；熟悉NV GPU高性能生态，有CUDA/Triton开发经验者优先；熟悉RDMA高性能通信，有NCCL/NVSHMEM/Triton-distributed开发经验者优先；每周可以实习4天及以上，可连续实习三个月以上。具有复杂问题的分析和解决能力，有解决困难问题的自驱力与信心。 - 若具备以下经验将加分：有算法背景，了解常见的大模型SFT/RL算法。有开源经验，在mlsys相关背景的开源项目上贡献过代码。实习信息 - 实习周期：3 个月起（可长期） - 工作模式：线下（上海） - 实习津贴：视能力与经验面议 - 提供：导师指导、真实项目机会、优秀者可转正

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

上海奇绩智研智能科技有限公司

互联网

未融资

上海市

查看其他 4 个职位

0 笔试题目 0 面试经验 0 面试短评