内推|视频生成强化学习算法工程师|米哈游|实习生

内推码:J4VQ9

岗位链接:链接

岗位名称:视频生成强化学习算法工程师

投递的时候,请填写内推码,方便我跟进后续流程;实习岗位一般至少5个工作日才有进度更新,请耐心等候;

也欢迎同学们内部相互推荐,实习相对比较容易拿到米哈游的offer

工作职责

负责视频生成模型在后训练/强化学习阶段的算法研发与模型训练,运用前沿强化学习算法优化模型的稳定性与视频生成质量,并实现对人类专家审美偏好的深度对齐。

核心职责

  • 1、深入研究前沿强化学习算法,负责视频生成任务中的基于强化学习的优化方案探索及训练框架搭建;
  • 2、结合视频生成模型的效果短板,分析强化学习算法的优化目标,设计数据收集方案;
  • 3、设计并实现面向视频生成的多目标强化学习算法,设计并训练奖励模型(Reward Model);
  • 4、撰写高质量技术报告与论文,与团队共同推动技术创新,保持行业领先地位。

任职要求

  • 1、硕士及以上学历,计算机科学、电子工程、人工智能等相关专业;
  • 2、2年以上图像/视频生成、强化学习或其他计算机视觉相关领域工作经验;
  • 3、具备出色的编程与算法实现能力,熟练掌握主流深度学习框架(如 PyTorch),并拥有熟练的模型训练与调优经验;

加分项

  • 1、熟悉扩散模型及其不同变体,如 Score Model、DDPM、DDIM、Flow Matching 等,了解 SDE、ODE 等理论范式;
  • 2、作为核心作者在顶级机器学习/视觉/图形学会议或期刊(如 CVPR、ICCV、ECCV、NeurIPS、ICML、ICLR、SIGGRAPH)发表过高水平论文;
  • 3、具备大规模分布式模型训练的实际经验;
  • 4、在开源社区(如 GitHub)有影响力项目的贡献经历;
  • 5、具备强烈的自我驱动力、优秀的团队协作能力,以及对前沿技术挑战的极大热情;

面向对象

全体在校生

alt

#米哈游##实习##内推#
全部评论
考虑南京OD的宝子们看过来,你就是我们要找的人,我们有大量的HC,可私信
点赞 回复 分享
发布于 2025-08-19 20:47 贵州

相关推荐

牛客76783384...:字节:不要放箭,活捉赵子龙
点赞 评论 收藏
分享
最终还是婉拒了小红书的offer,厚着脸皮回了字节。其实这次字节不管是组内的氛围、HR的沟通体验,都比之前好太多,开的薪资也还算过得去,这些都是让我下定决心的原因之一。但最核心的,还是抵不住对Agent的兴趣,选择了Ai Coding这么一个方向。因为很多大佬讲过,在未来比较火的还是属于那些更加垂类的Agent,而Ai Coding恰好是Coding Agent这么一个领域,本质上还是程序员群体和泛程序员群体这个圈子的。目前也已经在提前实习,也是全栈这么一个岗位。就像最近阿里P10针对前端后端等等不再那么区分,确实在Agent方向不太区分这个。尤其是我们自己做AI Coding的内容,基本上90%左右的内容都是AI生成的,AI代码仓库贡献率也是我们的指标之一。有人说他不好用,那肯定是用的姿态不太对。基本上用对Skill、Rules 加上比较好的大模型基本都能Cover你的大部分需求,更别说Claude、Cursor这种目前看来Top水准的Coding工具了(叠甲:起码在我看来是这样)。所以不太区分的主要原因,还是针对一些例如Claude Code、Cursor、Trae、Codex、CC等一大堆,他们有很多新的概念和架构提出,我们往往需要快速验证(MVP版本)来看效果。而全栈就是这么快速验证的一个手段,加上Ai Coding的辅助,目前看起来问题不大(仅仅针对Agent而言)。而且Coding的产品形态往往是一个Plugin、Cli之类的,本质还是属于大前端领域。不过针对业务后端来看,区分还是有必要的。大家很多人也说Agent不就是Prompt提示词工程么?是的没错,本质上还是提示词。不过现在也衍生出一个新的Context Eneering,抽象成一种架构思想(类比框架、或者你们业务架构,参考商品有商品发布架构来提效)。本质还是提示词,但是就是能否最大化利用整个上下文窗口来提升效果,这个还是有很多探索空间和玩法的,例如Cursor的思想:上下文万物皆文件, CoWork之类的。后续也有一些Ralph Loop啥的,还有Coding里面的Coding Act姿态。这种才是比较核心的点,而不是你让AI生成的那提示词,然后调用了一下大模型那么简单;也不是dify、LangGraph搭建了一套workflow,从一个node走到另外一个node那么简单。Agent和WorkFLow还是两回事,大部分人也没能很好的区分这一点。不过很多人说AI泡沫啥啥啥的,我们ld也常把这句话挂在嘴边:“说AI泡沫还是太大了”诸如此类。我觉得在AI的时代,懂一点还是会好一点,所以润去字节了。目前的实习生活呢,除了修一些Tools的问题,还包括对比Claude、Cursor、Trae在某些源码实现思想上的点,看看能不能迁移过来,感觉还是比较有意思。不过目前组内还是主要Follow比较多,希望下一个阶段就做一些更有创新的事情哈哈。这就是一个牛马大学生的最终牧场,希望能好好的吧。说不定下次发的时候,正式AI泡沫结束,然后我又回归传统后端这么一个结局了。欢迎交流👏,有不对的🙅不要骂博主(浅薄的认知),可以私聊交流
码农索隆:和优秀的人,做有挑战的事
点赞 评论 收藏
分享
评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务