算法工程师-强化学习【转正实习】
薪资面议
算法工程师 杭州 本科 2026届

岗位关键词
毕业要求:2026届
投递时间:2025年2月24日-2025年7月31日(即将截止)
岗位职责
我们正在构建一个创新的数据分析诊断模型,旨在通过强化学习(RL)与大语言模型(LLM)技术的结合,为商家提供智能化的店铺运营支持。该模型将帮助商家提高运营效率和服务质量,实现数据驱动的决策优化。
培养方向:
1. 参与系统的需求分析、架构设计与开发工作,确保算法模型的高效落地与业务目标的达成。
2. 结合大语言模型(LLM)与强化学习(RL)技术,设计并实现智能化的文本生成模型,助力商家运营效率和服务质量的全面提升。
3. 持续关注并研究强化学习领域的前沿技术动态,探索新方法与新思路,推动技术创新在实际业务中的落地应用。
岗位要求
1. 计算机科学、数学、统计学、自动化等相关专业本科及以上学历。
2. 熟悉Post-Training流程及其在各大公司中的不同应用方式(如Qwen K1.5, DeepSeek-R1等)。
3. 深入了解RL领域,包括但不限于RM、PPO、DPO、ORPO、GRPO、MBRL、DDPG、DDQN等算法。
4. 精通LLM&NLP领域,涵盖LLM训练(CPT、SFT)、文本分类、信息抽取、搜索算法等。
5. 具备扎实的机器学习、深度学习与自然语言处理理论基础,熟悉主流预训练模型如BERT、Transformer、ViT、CLIP等。
6. 精通Python开发,具备丰富的算法实现经验,熟练使用PyTorch等深度学习框架进行模型训练与部署。
7. 出色的逻辑思维与问题解决能力,能够快速分析并解决复杂的技术难题。强烈的自驱力与业务导向,能够在快节奏环境中高效完成任务并达成业务目标。
【加分项】
1. 在Kaggle、天池等平台获得Top10%成绩者优先考虑。
2. 有GitHub开源项目贡献经历,且项目星级≥50。
3. 在ACL、EMNLP、NAACL、ICLR、NeurIPS等相关顶会发表过论文者优先。
4. 已具备LLM&RL开发和实际落地经验,对深度学习框架内部架构有深入理解。
5. 对AI技术充满热情,具有强烈的好奇心与钻研精神,在细分领域算法中有独特见解。
招聘对象:2025.11-2026.10毕业
牛客安全提示:如发现虚假招聘、广告,或以任何名义索要证件、费用,或诱导异地入职、参与培训等均属违法行为,发现请
立即举报