深度学习新浪潮:Sora-2上线与AI视频生成模型研发进展(2025.10) Sora-2的核心技术突破 Sora-2作为OpenAI推出的新一代视频生成模型,采用多模态混合架构,融合扩散模型(Diffusion Models)与时空注意力机制。其核心改进包括: 时空一致性增强:通过3D卷积核与长序列Transformer的协同训练,解决视频帧间闪烁问题,生成片段可达120秒且保持动态连贯性。 物理引擎嵌入:在潜空间建模中引入刚体动力学约束,使虚拟物体运动符合真实物理规律(如碰撞反弹、流体模拟)。 多粒度控制:支持文本、图像、音频多模态输入,用户可通过语义分割图精确控制场景布局。 技术指标...