阿里算法大模型二面-校招
二面:
1.项目介绍
2. CogVideoX的模型结构、3D VAE的压缩率、MM-DiT的优势、4f+1为什么要+1
3.FLUX的结构,生成模型的优势
4.SD3的架构,生成原理Flow matching
5.VQ-VAE使用的的损失函数,训练过程
6.VQ-VAE中codebook中的code有的被使用的概率很低,这个是怎么解决的
7. Lora的原理,LORA在推理的时候怎么与原参数融合不带来时间成本
8. Flow matching与DDPM的区别及优势
9.Wan2.1的详细架构和训练细节
10.代码题:0841.钥匙和房间
1.项目介绍
2. CogVideoX的模型结构、3D VAE的压缩率、MM-DiT的优势、4f+1为什么要+1
3.FLUX的结构,生成模型的优势
4.SD3的架构,生成原理Flow matching
5.VQ-VAE使用的的损失函数,训练过程
6.VQ-VAE中codebook中的code有的被使用的概率很低,这个是怎么解决的
7. Lora的原理,LORA在推理的时候怎么与原参数融合不带来时间成本
8. Flow matching与DDPM的区别及优势
9.Wan2.1的详细架构和训练细节
10.代码题:0841.钥匙和房间
全部评论
相关推荐
点赞 评论 收藏
分享