有想来AI Agent公司做算法的吗?强化学习方向,可内推!!

坐标:深圳南山区
岗位职责:
1. 负责电商领域的Agent效果提升工作,主导大模型(LLM)的强化学习微调框架设计与实现,通过RFT/RLHF等方案提升模型推理、逻辑链与多步决策能力;
2. 构建高效反馈机制(人类偏好数据、规则引擎、AI评估器),解决大模型幻觉、逻辑错误与价值观对齐问题;
3. 优化基于PPO/DPO等算法的训练流程,实现电商场景中的动态广告竞价, 赋能电商企业科学的库存管理能力,优化AI产品的选品推荐系统;
4. 设计大模型能力评估体系,量化推理能力提升效果,推动模型迭代与落地应用。
我们期待的你:
1.本科及以上学历,计算机、人工智能、数据科学等相关专业,3年以内相关工作经验(985/211/海外知名高校优先),也欢迎优秀的应届毕业生;
2.100%拥抱AI技术,有技术钻研精神,能够跟进最新的AI研究进展;
3.具备扎实的机器学习,深度学习, 强化学习能力, 熟练掌握RFT/RLHF,具备端到端的动手实践能力;
4.良好的问题分析和解决能力,能够将复杂业务需求转化为技术实现方案;
5.良好的代码开发习惯和技术栈,精通Python。
全部评论

相关推荐

彧未sr:查看图片
投递牧原集团等公司10个岗位
点赞 评论 收藏
分享
07-10 14:08
已编辑
江西农业大学 Java
拒绝无效加班的小学生...:期望3k吗?java这辈子有了
点赞 评论 收藏
分享
25届的可以参加26届秋招吗?身为25届的,现在辞职很尴尬,经验不足一年(正式工)又正在秋招,现在找工作有点尬住了
程序员小白条:哪有一年啊,才几个月吧,参加26秋招不存在的,社招了啊,你正式工都交过社保了
点赞 评论 收藏
分享
评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务