(社招)京东-算法工程师- LLM强化学习

岗位职责
负责多智能体的强化学习和多智能体联合训练
- 负责大模型的工业应用与算法落地,包括但不限于智能问答、RAG和Agent等领域;
- 在特定领域和场景下,对大模型进行继续训练,涉及微调和强化学习等方法,优化大语言模型在业务场景中的应用效果;
- 跟进大模型与强化学习技术的前沿发展,提升算法效率与性能。
任职要求
- 硕士及以上学历,计算机科学、数学、运筹学、统计学等相关专业;
- 熟悉大模型领域的前沿技术,掌握大模型的基本原理及其训练和微调方法;
- 深入理解强化学习的知识体系,熟悉主流强化学习算法如PPO、A3C、DQN等;
- 熟练使用Python或C++等编程语言,掌握常用数据结构;熟练使用TensorFlow或PyTorch等至少一种深度学习框架;
- 有RLHF、多智能体学习、分布式强化学习等实际训练和应用落地经验者优先;
- 在顶级会议或期刊上发表过论文,或参加过国际竞赛并取得优异成绩者优先。
有意者联系:liuzhilei12@jd.com
全部评论

相关推荐

2025-12-08 07:42
门头沟学院 Java
27届末九,由于是女生,身边人几乎没有就业导向的,自学只能跟着网课,没人指导,很迷茫。下图是我目前的简历,不知道有需要修改的地方吗?求拷打。下面是目前的学习情况:目前算法过完了一遍力扣100和代码随想录,不过不是很熟,面经看了小林coding、JavaGuide,有一些没用过的技术看得不是很明白,掌握得不是很扎实。再加上常年跟黑马网课听思路,真正自己动手写代码的时间很少,这让我一直不敢投简历,总觉得内里空虚。项目没准备好面试相关的问题,简历上相应的考点不熟。如此种种。。。看到很多很多学长学姐大佬们的面经,愈发觉得面试可怕,自己没准备好,总担心自己是不是无望后端开发了。看到牛客很多同届以及更小一届的同学都找到实习了,很希望自己也能找到实习。而自己又好像摸不到后端学习的门路,只能不断赞叹黑马虎哥写的代码真优雅!微服务架构实在巧妙!消息队列、redis、sentinel、nacos、mybatisplus等等的引入都会让我赞叹这些工具的设计者的巧思,以及包括但不限于Java语言的优雅。然而只是停留在了解的程度,并不熟练。我是很希望能够继续深入探索这些知识的,只不过有一大部分时间都花在学校课程上了。我感觉我被困住了,我一方面必须保证我能够有个不错的学业分使我能有我几乎不想选择的读研退路(还有个原因是复习不全我会焦虑考试挂科,因此我会做好全面的准备,而这一步很费时间),一方面在B站学习各种网课,一方面得考虑提升自己并不扎实的算法基础,另一方面还得准备八股面经。这让我有点苦恼,我好像没那么多时间,因为绝大部分时间都花在了复习学校科目中了。我好像处处用时间,但收效甚微。想问问各位大佬是怎么平衡时间的呢?算法、项目和八股是怎么准备的呢?有什么高效的方法吗?谢谢您们花时间阅读我的稿件!
菜菜狗🐶:大胆投,我当时也是害怕面试,投多了发现根本约不到面🤡
投递哔哩哔哩等公司10个岗位
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务