首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
喜欢飞来飞去的奶糖想开了
中国人民解放军国防科技大学 算法工程师
发布于湖南
关注
已关注
取消关注
@沉迷单车:
Diffusion Models视频生成-博客汇总
0、【论文汇总】Diffusion Models视频生成/视频编辑/可控视频生成/跨模态视频生成本文总结了Diffusion Models视频生成领域相关的工作,目前共收录142篇,持续更新中。1、Video Diffusion Models:基于扩散模型的视频生成扩散模型已经被广泛运用到图像生成、image-to-image转换、时间序列生成、3D点云生成、文本生成、音频生成等领域,谷歌研究院最新的研究成果成功将diffusion models运用到视频生成领域。2、详细解读 VideoFactory:Swap Attention in Spatiotemporal Diffusions for Text-to-Video GenerationVideoFactory提出了一种新颖的交换时空交叉注意机制来加强空间和时间之间的相互作用,并发布了目前最大的视频数据集,包含了130万个文本-视频对。这篇博客详细解读一下这篇论文的创新点,希望能对做扩散模型视频生成的读者有所帮助。3、文生视频领域SOTA工作Make-A-Video:论文解读和代码赏析2022年年底Meta AI提出了Make-A-Video,一年过去了依旧是文生视频领域的SOTA工作,在主流数据集上依旧保持着最先进的指标。论文利用了预训练的Text-to-Image模型扩展到Text-to-Video任务,大大降低了视频生成的门槛;论文中提出的伪三维卷积层和伪三维注意力层也被后来的研究广泛借鉴。这篇博客详细解读Make-A-Video的论文和源代码,并给出一些博主的思考和见解。4、Diffusion Models可控视频生成Control-A-Video:论文和源码解读Diffusion视频生成的时间连贯性问题是可控视频生成问题最大的挑战。Control-A-Video提出的时空一致性建模法、残差噪声初始化法和首帧定型法能有效解决这一问题,非常值得我们借鉴。博主详细解读论文和代码,并给出一些自己的思考。5、【Diffusion 视频生成】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video GenerationTune-A-Video提出了一个新的文本-视频任务:One-Shot视频生成,能够在视频对象编辑、背景编辑、风格转换、可控生成等领域取得了非常好的效果。这篇博客详细解读Tune-A-Video的论文和代码,希望能对做扩散模型视频生成的读者们有所帮助。6、文生视频领域SOTA工作 Show-1:论文和代码解读最近的text-to-video的论文Show-1在MSR-VTT测评数据集上取得了FVD和CLIPSIM指标上的第一名,FID指标上的第二名。采用混合模型的方法,结合了基于像素的VDM和基于潜在空间的VDM进行文本到视频的生成,不仅能取得很高的生成指标,还能大大降低推理资源消耗。这篇博客详细解读一下这篇论文和代码。7、【CVPR 2023】解读VideoFusion:基于噪声共享机制的视频生成达摩院开源的VideoFusion是为数不多同时开源模型和推理代码的视频生成工作,通过设计噪声分解机制有效提高视频的时空连贯性,在一些关键指标上远超GAN-based方法和2022年谷歌的VDM。更重要的是,Diffusers库以此为基础,写了关键的两个视频生成基础类,堪称行业标准。这篇博客就详细解读一下这篇经典的论文。8、【NeurIPS 2023】并行多模态视频生成大模型CoDi目前视频生成的大部分工作都是只能生成无声音的视频,距离真正可用的视频还有不小的差距。CoDi提出了一种并行多模态生成的大模型,可以同时生成带有音频的视频,距离真正的视频生成更近了一步。相信在不远的将来,可以AI生成的模型可以无缝平替抖音等平台的短视频。这篇博客详细解读一下这篇论文《Any-to-Any Generation via Composable Diffusion》。9、解读VideoComposer:多模态融合视频生成达摩院出品的VideoComposer,是Composer家族的重要成员,开辟了组合多种模态特征生成视频的先河。重要的是开源了推理代码和模型,利于后人研究。这篇博客详细解读一下VideoComposer论文原理。10、解读电影级视频生成模型 MovieFactoryMovieFactory是第一个全自动电影生成模型,可以根据用户输入的文本信息自动扩写剧本,并生成电影级视频。其中针对预训练的图像生成模型与视频模型之间的gap提出了微调方法非常值得借鉴。这篇博客详细解读一下这篇论文《MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images》11、解读文生视频大模型ModelScopeT2V技术报告ModelScopeT2V是17B的文生视频大模型,由阿里巴巴达摩院发布,且模型和代码完全开源。当中提出的多层时空机制和多帧训练法非常值得借鉴。这篇博客详细解读一下ModelScopeT2V背后的技术。12、解读Sketching the Future (STF):零样本条件视频生成基于草图的视频生成目前是一个基本无人探索过的领域,videocomposer做过一些简单的探索。Sketching the Future从零样本条件视频生成出发,出色的完成了这一任务。这篇博客就解读一下《Sketching the Future (STF): Applying Conditional Control Techniques to Text-to-Video Models》。
点赞 4
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-11 10:52
香港岭南大学 产品经理
求内推|产品经理|SaaS / 电商|深圳优先,可远程
2025届硕士,产品方向,现寻提前批/秋招产品经理机会!专业:人工智能与商业分析(硕)|工程管理(本)意向城市:深圳 / 广州 / 上海 / 可远程产品技能:需求分析 / 原型设计 / 用户洞察 / 项目推进 工具掌握:Axure、墨刀、Python、SQL、Visio、Xmind项目经验:参与3段一线互联网公司产品实习,覆盖教育SaaS、电商工具等方向,涉及功能规划、原型设计、PRD撰写与跨团队推进入职时间:2024年8月起期望薪资:看成长空间,合理即可~简历&原型展示图已附,如有机会十分希望参与团队流程实践,欢迎私信/评论交流~感谢支持!
投递墨刀等公司7个岗位
点赞
评论
收藏
分享
07-13 14:45
南华大学 Java
牛油们,求看看简历,听劝
北斗导航Compas...:
英文和中文之间加个空格,有的句子有句号 有的没。其他没啥问题
点赞
评论
收藏
分享
06-21 01:03
门头沟学院 Java
家人们,梦彻底醒了
双非一本,大三下了,今天第一次面试,项目是编的,一问直接露馅了,昨天开始背的八股文,今天全忘了,大学三年确实是玩爽了,今天面试完彻底觉悟了,现在目标秋招了,暑期实习是指望不上了,兄弟们有没有好的建议,本人孙吧七年吧龄,请狠狠压力我,我都能听得进去的
黎寻汐:
先别面试了,赶紧扒两个项目吧,八股文也要过一遍。我动态里面的那些面经都是小公司,你看过去一遍能应付哪个?现在开始每天学8小时,还有机会
还记得你第一次面试吗?
点赞
评论
收藏
分享
06-16 00:33
淮阴工学院 网络安全
笑死了,27届第一次投简历就过了
鼠鼠是双非二本,非科班本科生,目前大二,主攻网络安全方面的内容,在这方面小有成就,想着暑假没事干就投个简历,boss问了几家头部点公司没人理我,就去官网搜了几家,发现360公司好像明确招收27届的,投了一下,感觉面的不咋地,问到我Shiro反序列化原理,我直接说了不会面试官直接下一个问题,但好在fastjson我有研究的,答的很专业,然后后面就简单问了一些问题就过了,过了几天就收到hr电话了,就这么直接过了,没有丝毫波折哈哈哈哈(之前一直焦虑实习问题还托关系面了亚信,我第一次不知道是哪个地区的亚信,我以前上海的,好像就因为这个问题他给我挂了,怪无语的,连简历都没看,就聊了几句,有一说一我这个简历感觉无敌好吧,其实还有一些偏门的东西没写上去,写了感觉怪怪的也不实用)
MIX米线:
你这项目经历有点猛哦
投递亚信科技(中国)有限公司等公司7个岗位
点赞
评论
收藏
分享
07-15 11:45
门头沟学院 Java
百度提前批一面
凉凉现在面试节点灰色,简历显示共享中,之后还能被捞起来吗?
百度一面652人在聊
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
关于项目烂大街的那些事
9097
2
...
0实习0面试, 速通拼多多
8614
3
...
秋招公司情报局,分享线索得牛币💰
7665
4
...
秋招腾讯TEG提前批(三面挂)
6716
5
...
后端实习到底该干什么啊
5528
6
...
从外包到正式工,从Java开发到私有云运维:我的职场逆袭之路
4583
7
...
双非本应届是如何拿到30
3493
8
...
明天五场面试,加油
3342
9
...
王侯将相宁有种乎!
3027
10
...
我和妈妈讲以后我可能给不了她一个月1500
2886
创作者周榜
更多
正在热议
更多
#
26届的你们有几段实习?
#
20381次浏览
276人参与
#
你小时候最想从事什么职业
#
102801次浏览
1771人参与
#
你被哪些公司秒挂过?
#
18989次浏览
185人参与
#
网申一定要掌握的小技巧
#
9704次浏览
65人参与
#
如何提高实习转正率?
#
7693次浏览
135人参与
#
新凯来求职进展汇总
#
41076次浏览
108人参与
#
你认为哪些项目算烂大街?
#
8548次浏览
196人参与
#
机械校招之路总结
#
92468次浏览
1889人参与
#
你后悔自己读研吗?
#
9196次浏览
176人参与
#
你以为的实习VS真实的实习
#
11902次浏览
133人参与
#
月薪多少能在一线城市生存
#
11029次浏览
172人参与
#
腾讯工作体验
#
480033次浏览
3498人参与
#
找工作时的取与舍
#
81359次浏览
578人参与
#
最难的技术面是哪家公司?
#
6110次浏览
58人参与
#
秋招拿一个offer可以躺平吗
#
145014次浏览
928人参与
#
安利/避雷我的专业
#
77792次浏览
526人参与
#
面试等了一周没回复,还有戏吗
#
137218次浏览
1229人参与
#
你想留在一线还是回老家?
#
50122次浏览
513人参与
#
选择和努力,哪个更重要?
#
86073次浏览
745人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
115012次浏览
799人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务