有想来AI Agent公司做算法的吗?强化学习方向,可内推!!
坐标:深圳南山区
岗位职责:
1. 负责电商领域的Agent效果提升工作,主导大模型(LLM)的强化学习微调框架设计与实现,通过RFT/RLHF等方案提升模型推理、逻辑链与多步决策能力;
2. 构建高效反馈机制(人类偏好数据、规则引擎、AI评估器),解决大模型幻觉、逻辑错误与价值观对齐问题;
3. 优化基于PPO/DPO等算法的训练流程,实现电商场景中的动态广告竞价, 赋能电商企业科学的库存管理能力,优化AI产品的选品推荐系统;
4. 设计大模型能力评估体系,量化推理能力提升效果,推动模型迭代与落地应用。
我们期待的你:
1.本科及以上学历,计算机、人工智能、数据科学等相关专业,3年以内相关工作经验(985/211/海外知名高校优先),也欢迎优秀的应届毕业生;
2.100%拥抱AI技术,有技术钻研精神,能够跟进最新的AI研究进展;
3.具备扎实的机器学习,深度学习, 强化学习能力, 熟练掌握RFT/RLHF,具备端到端的动手实践能力;
4.良好的问题分析和解决能力,能够将复杂业务需求转化为技术实现方案;
5.良好的代码开发习惯和技术栈,精通Python。
岗位职责:
1. 负责电商领域的Agent效果提升工作,主导大模型(LLM)的强化学习微调框架设计与实现,通过RFT/RLHF等方案提升模型推理、逻辑链与多步决策能力;
2. 构建高效反馈机制(人类偏好数据、规则引擎、AI评估器),解决大模型幻觉、逻辑错误与价值观对齐问题;
3. 优化基于PPO/DPO等算法的训练流程,实现电商场景中的动态广告竞价, 赋能电商企业科学的库存管理能力,优化AI产品的选品推荐系统;
4. 设计大模型能力评估体系,量化推理能力提升效果,推动模型迭代与落地应用。
我们期待的你:
1.本科及以上学历,计算机、人工智能、数据科学等相关专业,3年以内相关工作经验(985/211/海外知名高校优先),也欢迎优秀的应届毕业生;
2.100%拥抱AI技术,有技术钻研精神,能够跟进最新的AI研究进展;
3.具备扎实的机器学习,深度学习, 强化学习能力, 熟练掌握RFT/RLHF,具备端到端的动手实践能力;
4.良好的问题分析和解决能力,能够将复杂业务需求转化为技术实现方案;
5.良好的代码开发习惯和技术栈,精通Python。
全部评论
相关推荐
jnsytgsyqj...:百度实习生还累吗
我这边实习生天天玩手机

点赞 评论 收藏
分享