首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
喜欢飞来飞去的奶糖想开了
中国人民解放军国防科技大学 算法工程师
发布于湖南
关注
已关注
取消关注
@沉迷单车:
Diffusion Models视频生成-博客汇总
0、【论文汇总】Diffusion Models视频生成/视频编辑/可控视频生成/跨模态视频生成本文总结了Diffusion Models视频生成领域相关的工作,目前共收录142篇,持续更新中。1、Video Diffusion Models:基于扩散模型的视频生成扩散模型已经被广泛运用到图像生成、image-to-image转换、时间序列生成、3D点云生成、文本生成、音频生成等领域,谷歌研究院最新的研究成果成功将diffusion models运用到视频生成领域。2、详细解读 VideoFactory:Swap Attention in Spatiotemporal Diffusions for Text-to-Video GenerationVideoFactory提出了一种新颖的交换时空交叉注意机制来加强空间和时间之间的相互作用,并发布了目前最大的视频数据集,包含了130万个文本-视频对。这篇博客详细解读一下这篇论文的创新点,希望能对做扩散模型视频生成的读者有所帮助。3、文生视频领域SOTA工作Make-A-Video:论文解读和代码赏析2022年年底Meta AI提出了Make-A-Video,一年过去了依旧是文生视频领域的SOTA工作,在主流数据集上依旧保持着最先进的指标。论文利用了预训练的Text-to-Image模型扩展到Text-to-Video任务,大大降低了视频生成的门槛;论文中提出的伪三维卷积层和伪三维注意力层也被后来的研究广泛借鉴。这篇博客详细解读Make-A-Video的论文和源代码,并给出一些博主的思考和见解。4、Diffusion Models可控视频生成Control-A-Video:论文和源码解读Diffusion视频生成的时间连贯性问题是可控视频生成问题最大的挑战。Control-A-Video提出的时空一致性建模法、残差噪声初始化法和首帧定型法能有效解决这一问题,非常值得我们借鉴。博主详细解读论文和代码,并给出一些自己的思考。5、【Diffusion 视频生成】Tune-A-Video: One-Shot Tuning of Image Diffusion Models for Text-to-Video GenerationTune-A-Video提出了一个新的文本-视频任务:One-Shot视频生成,能够在视频对象编辑、背景编辑、风格转换、可控生成等领域取得了非常好的效果。这篇博客详细解读Tune-A-Video的论文和代码,希望能对做扩散模型视频生成的读者们有所帮助。6、文生视频领域SOTA工作 Show-1:论文和代码解读最近的text-to-video的论文Show-1在MSR-VTT测评数据集上取得了FVD和CLIPSIM指标上的第一名,FID指标上的第二名。采用混合模型的方法,结合了基于像素的VDM和基于潜在空间的VDM进行文本到视频的生成,不仅能取得很高的生成指标,还能大大降低推理资源消耗。这篇博客详细解读一下这篇论文和代码。7、【CVPR 2023】解读VideoFusion:基于噪声共享机制的视频生成达摩院开源的VideoFusion是为数不多同时开源模型和推理代码的视频生成工作,通过设计噪声分解机制有效提高视频的时空连贯性,在一些关键指标上远超GAN-based方法和2022年谷歌的VDM。更重要的是,Diffusers库以此为基础,写了关键的两个视频生成基础类,堪称行业标准。这篇博客就详细解读一下这篇经典的论文。8、【NeurIPS 2023】并行多模态视频生成大模型CoDi目前视频生成的大部分工作都是只能生成无声音的视频,距离真正可用的视频还有不小的差距。CoDi提出了一种并行多模态生成的大模型,可以同时生成带有音频的视频,距离真正的视频生成更近了一步。相信在不远的将来,可以AI生成的模型可以无缝平替抖音等平台的短视频。这篇博客详细解读一下这篇论文《Any-to-Any Generation via Composable Diffusion》。9、解读VideoComposer:多模态融合视频生成达摩院出品的VideoComposer,是Composer家族的重要成员,开辟了组合多种模态特征生成视频的先河。重要的是开源了推理代码和模型,利于后人研究。这篇博客详细解读一下VideoComposer论文原理。10、解读电影级视频生成模型 MovieFactoryMovieFactory是第一个全自动电影生成模型,可以根据用户输入的文本信息自动扩写剧本,并生成电影级视频。其中针对预训练的图像生成模型与视频模型之间的gap提出了微调方法非常值得借鉴。这篇博客详细解读一下这篇论文《MovieFactory: Automatic Movie Creation from Text using Large Generative Models for Language and Images》11、解读文生视频大模型ModelScopeT2V技术报告ModelScopeT2V是17B的文生视频大模型,由阿里巴巴达摩院发布,且模型和代码完全开源。当中提出的多层时空机制和多帧训练法非常值得借鉴。这篇博客详细解读一下ModelScopeT2V背后的技术。12、解读Sketching the Future (STF):零样本条件视频生成基于草图的视频生成目前是一个基本无人探索过的领域,videocomposer做过一些简单的探索。Sketching the Future从零样本条件视频生成出发,出色的完成了这一任务。这篇博客就解读一下《Sketching the Future (STF): Applying Conditional Control Techniques to Text-to-Video Models》。
点赞 4
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
昨天 16:52
已编辑
门头沟学院 Java
地平线校招
周五投的,流程今天结束
投递地平线等公司7个岗位
点赞
评论
收藏
分享
07-10 20:07
广东海洋大学 运营
巨头博弈与本土突围,解析智能酒店清洁机器人市场竞争版图
在科技飞速发展与酒店行业数字化转型的大背景下,智能酒店清洁机器人凭借其高效、智能的特性,成为提升酒店运营效率和服务质量的关键利器。2025 年相关研究数据显示,全球智能酒店清洁机器人市场正处于快速增长阶段,其发展态势备受瞩目。路亿(广州)市场策略有限公司(LP Information)作为具备全球先进技术产业深度调研分析能力的研究机构,对该市场有着深入且全面的研究 。一、研究基础与方法1.1 核心概念界定智能酒店清洁机器人是融合人工智能技术、传感器系统和自动化控制的高效清洁设备,专为酒店环境量身定制。它能够自动完成地面清扫、拖地、消毒等多项清洁任务,同时具备路径规划、自主避障和远程监控功...
点赞
评论
收藏
分享
07-08 17:23
腾讯音乐娱乐集团_客户端(准入职员工)
mentor手把手教我包装简历
我的简历可以说是全是水份实习期间在给mentor打杂后面写简历把mentor干的活全写进去了然后发给他看让他锐评一下后续秋招每一轮面试都会问这个优化问题,大部分情况都能答出来,偶尔遇到面试官问的非常细的时候,我就再去骚扰mentor,让他给我解答,让简历里的这个点做到滴水不漏。
勇敢的马后炮炮手在写...:
你起一个中介作用
简历当中有水分算不算造假...
点赞
评论
收藏
分享
06-02 23:35
门头沟学院 后端
在 boss 上找到了好工作
六十块钱的发烧友,哈哈哈哈哈哈哈哈哈哈
门口唉提是地铁杀:
之前b站被一个游戏demo深深的吸引了。看up主页发现是个初创公司,而且还在招人,也是一天60。二面的时候要我做一个登录验证和传输文件两个微服务,做完要我推到github仓库,还要我加上jaeger和一堆运维工具做性能测试并且面试的时候投屏演示。我傻乎乎的做完以后人家跟我说一句现在暂时不招人,1分钱没拿到全是白干
你的秋招第一场笔试是哪家
点赞
评论
收藏
分享
今天 18:53
门头沟学院 Java
快手提前批
一面不出意料的挂了 ,关于实习产出答得不好,自我感觉实习做的一般,自我认为学习能力还可以,基础题都答得差不多,但是对于真正工作的理解还是太浅了
投递快手等公司9个岗位
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
一个三无废物985硕士的求救帖!Help
3669
2
...
百度提前批一二面(已挂)
2780
3
...
秋招公司情报局,分享线索得牛币💰
2735
4
...
京东26届秋招提前批offer
2690
5
...
从互联网“逃”到车企,我找到了理想工作!应届生选车企真香?
2690
6
...
月薪一万五,天天都喊苦
2634
7
...
快手java后端实习生一面面经
2312
8
...
实习转正,要讲究天时地利人和
2308
9
...
关于项目烂大街的那些事
2224
10
...
手机厂工作一年了,给想进手机行业的兄弟们写点建议
2219
创作者周榜
更多
正在热议
更多
#
你被哪些公司秒挂过?
#
8778次浏览
116人参与
#
26届的你们有几段实习?
#
3103次浏览
64人参与
#
如何提高实习转正率?
#
4905次浏览
95人参与
#
第一份工作应该只看薪资吗
#
152876次浏览
1530人参与
#
大厂面试初体验
#
13021次浏览
88人参与
#
你想留在一线还是回老家?
#
48985次浏览
503人参与
#
你认为哪些项目算烂大街?
#
3402次浏览
84人参与
#
你以为的实习VS真实的实习
#
4242次浏览
70人参与
#
选完offer后,你后悔学本专业吗
#
47872次浏览
239人参与
#
离家近房租贵VS离家远但房租低,怎么选
#
9585次浏览
119人参与
#
你后悔自己读研吗?
#
4290次浏览
117人参与
#
最难的技术面是哪家公司?
#
2649次浏览
35人参与
#
拼多多工作体验
#
29450次浏览
201人参与
#
当下环境,你会继续卷互联网,还是看其他行业机会
#
113981次浏览
793人参与
#
月薪多少能在一线城市生存
#
5214次浏览
105人参与
#
leader认为你工作不认真怎么办
#
32022次浏览
150人参与
#
如果可以,你希望哪个公司来捞你
#
104223次浏览
502人参与
#
如果公司降薪,你会跳槽吗?
#
80071次浏览
588人参与
#
妈妈治愈了你哪些脆皮时刻
#
29407次浏览
321人参与
#
如果公司给你放一天假,你会怎么度过?
#
17650次浏览
129人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务