算法工程师-强化学习【转正实习】

薪资面议

算法工程师

本科

2026届

王女士 5分钟前在线

拉扎斯网络科技（上海）有限公司·招聘

反馈率：99% | 反馈时长：3天

岗位关键词

毕业要求：2026届

投递时间：2025年2月24日-2025年7月31日（即将截止）

岗位职责

我们正在构建一个创新的数据分析诊断模型，旨在通过强化学习（RL）与大语言模型（LLM）技术的结合，为商家提供智能化的店铺运营支持。该模型将帮助商家提高运营效率和服务质量，实现数据驱动的决策优化。培养方向： 1. 参与系统的需求分析、架构设计与开发工作，确保算法模型的高效落地与业务目标的达成。 2. 结合大语言模型（LLM）与强化学习（RL）技术，设计并实现智能化的文本生成模型，助力商家运营效率和服务质量的全面提升。 3. 持续关注并研究强化学习领域的前沿技术动态，探索新方法与新思路，推动技术创新在实际业务中的落地应用。

岗位要求

1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。 2. 熟悉Post-Training流程及其在各大公司中的不同应用方式（如Qwen K1.5, DeepSeek-R1等）。 3. 深入了解RL领域，包括但不限于RM、PPO、DPO、ORPO、GRPO、MBRL、DDPG、DDQN等算法。 4. 精通LLM&NLP领域，涵盖LLM训练（CPT、SFT）、文本分类、信息抽取、搜索算法等。 5. 具备扎实的机器学习、深度学习与自然语言处理理论基础，熟悉主流预训练模型如BERT、Transformer、ViT、CLIP等。 6. 精通Python开发，具备丰富的算法实现经验，熟练使用PyTorch等深度学习框架进行模型训练与部署。 7. 出色的逻辑思维与问题解决能力，能够快速分析并解决复杂的技术难题。强烈的自驱力与业务导向，能够在快节奏环境中高效完成任务并达成业务目标。【加分项】 1. 在Kaggle、天池等平台获得Top10%成绩者优先考虑。 2. 有GitHub开源项目贡献经历，且项目星级≥50。 3. 在ACL、EMNLP、NAACL、ICLR、NeurIPS等相关顶会发表过论文者优先。 4. 已具备LLM&RL开发和实际落地经验，对深度学习框架内部架构有深入理解。 5. 对AI技术充满热情，具有强烈的好奇心与钻研精神，在细分领域算法中有独特见解。招聘对象：2025.11-2026.10毕业

牛客安全提示：如发现虚假招聘、广告，或以任何名义索要证件、费用，或诱导异地入职、参与培训等均属违法行为，发现请立即举报

饿了么

消费生活

D轮及以上

上海

查看其他 15 个职位

6 笔试题目 36 面试经验 0 面试短评