算法工程师(大模型微调 / 强化学习)

薪资面议
算法工程师
广州
硕士
1-3年
岗位关键词
岗位职责
1. 负责大模型后训练核心工作,参与核心算法研究与重难点技术攻关,主导金融垂域投研、投资、投顾、风控等场景大模型训练优化;​ 2. 负责跟进业界文本 / 多模态预训练、强化学习、推理增强模型等前沿技术与方法,基于公司重点业务场景需求及企业知识库,研发行业领先的企业级大模型;​ 3. 参与训练平台建设,涵盖分布式训练、混合精度训练、DeepSpeed 优化等核心模块,打造高效的模型训练、优化、测评及推理部署流水线;​ 4. 负责完善模型评估体系,量化评估模型训练效果及生产环境下的泛化能力;​ 5. 负责建设并持续优化模型预训练、微调、强化学习相关的语料库与数据集,搭建生产级优化数据闭环;​ 6. 参与企业级大模型训练方案与技术路线规划,制定相关技术应用规范。​
岗位要求
1. 计算机科学、数学、统计学或相关领域的硕士或博士;​ 2. 至少 2 年大语言模型或多模态大模型训练相关研究或工作经验;​ 3. 具有百亿及以上参数级模型后训练经验,具备使用大规模数据集开展分布式训练的实践经验; 4. 掌握模型量化、蒸馏、LoRA、MoE 等技术,​熟悉大模型后训练核心算法(如 CPT、SFT、DPO、PPO、GRPO、RLHF 等);​ 5. 熟练掌握 PyTorch、HuggingFace、DeepSpeed、FSDP 等模型开发与训练工具;​ 6. 具备大规模行业训练语料库建设经验,熟悉指令集设计、复杂数据标注与合成方法;​ 7. 具备模型工程化落地能力,了解推理加速、模型压缩与部署技术,能配合推理团队完成模型上线落地;​ 8.具备方法论沉淀、跨团队协作及项目主导能力。 加分项​ 1. 在计算机、AI 、数学等领域顶会有专业论文发表或国内外计算机、数学竞赛获奖经历;​ 2. 具有金融行业(券商、基金、量化机构等)场景大模型训练落地经验;​ 3. 主导或深度参与垂域大模型建设项目经历;​ 4. 参与过知名商业大模型算法研发(如 智谱、文心一言、阿里通义等)或开源项目经历;​ 5. 具有国产 GPU 集群应用、训练、调优经验。
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请 立即举报
广发证券
证券
不需要融资
广州
查看其他 5 个职位