快手 可灵 多模态算法实习生

【可灵-视频生成-数据算法-实习生】
职位描述
1、为视觉生成模型构建高质量训练数据,兼顾多模态理解与生成相关工作,优化视觉生成模型的数据构建 pipeline,为模型性能提升提供可靠的数据支撑。
2、设计并落地数据有效性验证方案,验证数据对视觉生成模型训练的实际作用,探索数据在模型训练中的有效性。
3、在顶会顶刊上发表研究成果和开源代码,提升团队在多模态视频生成等领域的学术声望。
任职要求
1、硕士以上学历(在校生优先),计算机、人工智能、计算机视觉、数学等相关专业,具备多模态理解、视觉生成相关基础;
2、熟悉视频生成基础模型如SVD、Sora、meta moviegen、hunyun video等;
3、熟悉多模态大语言模型(deepseek/qwen等)、多模态理解生成、世界模型;
加分项:
1、有多模态大语言模型、图像/视频生成大规模训练和数据构建经验者优先;
2、学习能力强、自驱、代码能力强、善于解决问题者优先;
3、有一作顶会或顶刊论文发表经历或相关知名大模型开源项目者优先。
联系邮箱:xuyulong03@kuaishou.com
全部评论
急招急招
点赞 回复 分享
发布于 02-26 12:44 北京

相关推荐

一个爱玩迷宫的菜居:学校的利益和学生的利益冲突是极大的,其实学生在学校眼中就是一堆可以作为贡献就业率的KPI数字,具体你去哪了,他们根本就不会管你,他们只会在大四的时候催你签三方,对于好的能同情学生的导员,你偷偷去实习,如果没有明面上摊牌,告诉他,他是可以睁一只眼闭一只眼的,但是你一旦你明面摊牌了,辅导员会因为这件事情丢饭碗,毕竟辅导员也是夹着尾巴做人的打工人
点赞 评论 收藏
分享
我的几乎100%AI的一个平台,今天又让它给我改了20个bug  bug太多了,前前后后搞这个平台差不多一个月,快两个月了吧,总算差不多搞好了。这个平台大致上分为三个功能,还有一个是沙箱里边去执行用例的,这个是我另一个同事做的还有一个剩下那两部分大概是我做的,不过我是接手另一个同事的工作,所以说也不能说全是我做的吧一个就是利用browser use全流程UI自动化,当然并不是简简单单的调用官方的包就行了,还做了自己的一些处理,然后用了自己公司内部的一些API并不是用的官方的API,还有就是我设计了一个本地录制,然后回放,自己写的浏览器插件,如果说回放的时候遇到元素有问题的话,他就有AI自愈,然后回写那一步修复过的的最新元素,大概就是这样,这么一个简简单单的东西搞了好久好久,并且全流程自动化还是不稳定,不知道为啥虽然说起来简单,但其中一旦你搞下去了,这些过程中就会遇到奇奇怪怪的问题什么403鉴权问题呀,元素分页,然后过滤的一些前端页面的显示问题呀,然后用例执行过程中的状态的变更问题,然后还有就是如果说遇到特殊的用例,它有一些死循环问题,还有就是有一些抽屉会有动画,然后回放的时候的特殊处理,还有就是相同的元素的一些优先级锚点定位异常的那种兜底策略,然后降级选择机制之类的,反正还是挺复杂的,甚至还有我还做了一个并发的加锁方案基于redis的,反正挺复杂的,等着差不多搞起来之后总结总结,就可以拿这个去面试了
点赞 评论 收藏
分享
评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务