超参数科技-强化学习研究员

岗位名:强化学习研究员
岗位类型:人工智能

岗位职责:
• 参与强化学习相关技术的研发和实现,开发商业化解决方案,应用于游戏业务;
• 参与强化学习前沿技术在游戏场景下的前沿研究;
• 参与强化学习算法实现及框架搭建,探索不同品类游戏上 AI 的研发。


岗位要求:
• 计算机、数学、自动化等相关专业的本科及以上学位,有顶级会议或期刊论文者优先;
• 具有 1 年以上强化学习工作或研究经验,有优化理论、多智能体学习、分布式强化学习等经验者优先;
• 熟练使用 Python 或 C++ 编程语言,了解常用数据结构及算法,有ACM/Kaggle 竞赛经验者优先;
• 熟练使用 TensorFlow/PyTorch 等至少一种深度学习框架,有参与开源项目经验者优先;
• 对游戏及游戏 AI 有热情,有 100 小时以上的游戏经验者优先。


点击立即投递:


查看我发布的其他职位:
https://www.nowcoder.com/jobs/hr/39602?jobId=252032&pageSource=5011&channel=niupin_zpt

全部评论
内推码 NTAGG74,欢迎投递!
点赞 回复 分享
发布于 2023-07-20 15:53 广东

相关推荐

996的工作制还是没能硬啃下去,快要面试怂了,取消了
牛客80700350...:很正常,不是所有人都能接受这种强度的。不叫怯战,这叫明智
点赞 评论 收藏
分享
自从我室友在计算机导论课上听说了“刷 LeetCode 是进入大厂的敲门砖”,整个人就跟走火入魔了一样。他在宿舍门口贴了一张A4纸,上面写着:“正在 DP,请勿打扰,否则 Time Limit Exceeded。”日记本的扉页被他用黑色水笔加粗描了三遍:“Talk is cheap. Show me the code。”连宿舍聚餐,他都要给我们讲解:“今天的座位安排可以用回溯算法解决,但为了避免栈溢出,我建议用动态规划。来,这是状态转移方程:dp[i][j] 代表第 i 个人坐在第 j 个位置的最优解。”我让他去楼下取个快递,他不直接去,非要在门口踱步,嘴里念念有词:“这是一个图的遍历问题。从宿舍楼(root)到驿站(target node),我应该用 BFS 还是 DFS?嗯,求最短路径,还是广度优先好。”和同学约好出去开黑,他会提前发消息:“集合点 (x, y),我们俩的路径有 k 个交点,为了最小化时间复杂度,应该在 (x/2, y/2) 处汇合。”有一次另一个室友低血糖犯了,让他帮忙找颗糖,他居然冷静地分析道:“别急,这是一个查找问题。零食箱是无序数组,暴力查找是 O(n)。如果按甜度排序,我就可以用二分查找,时间复杂度降到 O(log n)。”他做卫生也要讲究算法效率:“拖地是典型的岛屿问题,要先把连通的污渍区块都清理掉。倒垃圾可以用双指针法,一个指针从左往右,一个从右往左,能最快匹配垃圾分类。”现在我们宿舍的画风已经完全变了,大家不聊游戏和妹子,对话都是这样的:“你 Two Sum 刷了几遍了?”“别提了,昨天遇到一道 Hard 题,我连暴力解都想不出来,最后只能看题解。你呢?”“我动态规划还不行,总是找不到最优子结构。今天那道接雨水给我整麻了。”……LeetCode 真的害了我室友!!!
老六f:编程嘉豪来了
AI时代还有必要刷lee...
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务