淘天多模态大模型算法面经

1.CogVideoX 的模型结构、3D VAE 的压缩率、MM - DiT 的优势、4f+1为什么要+1
2.FLUX 的结构,生成模型,优势
3.SD3的架构,生成原理 Flow matching
4.VQ - VAE 使用的的损失函数,训练过程
5.为什么用 Lora 微调,为什么不用 ControlNet
6.Lora 的原理, LoRA 在推理的时候怎么与原参数融合不带来时间成本
7.Flow matching 与 DDPM 的区别及优势
8.数据和 prompt 构建的过程
9,个人怎么看待视频生成和图像生成,更倾向于那种
10.Wan2.1的详细架构和训练细节
11.算法:0841.钥匙和房间
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

评论
1
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务