工作职责 1.探索 Diffusion MoE 架构在时序生成任务下的表现,包括但不限于视频生成、音频生成、动作生成;2.探索 Diffusion MoE 的网络架构、路由策略等,提升模型对异质化分布的建模能力,增强模型对时序、空间及语义信息的融合能力;任职要求1.26届或以后,计算机科学、数学、统计学或相关领域的硕士或博士研究生在读,实习时长3个月以上;2.熟练掌握扩散模型与MoE架构原理与应用,有中大型生成模型调优经验;3.熟悉Python、Java等至少一种编程语言至少一种深度学习框架,具有良好的编程能力和扎实的数学理论基础;4.关注行业前沿进展,对技术开发及应用有热情,有自己的想法并乐于挑战;5.良好的沟通能力,跨团队协作能力,具备出色的规划、执行力,强烈的责任感,以及优秀的学习能力和自我驱动力;加分项有视频生成、音频生成、动作生成等领域经验者优先在NeurIPS/ICML/CVPR等发表过生成模型相关论文者优先;获得过国际或国内赛事奖项者优先;熟悉分布式训练等工程技术者优先;投递链接:https://jobs.mihoyo.com?isRecommendation=true&recommendationCode=CFG4G#/campus/position/7310