AIGC算法工程师-面试八股文-2025年版本-算法八股文/工程八股文/开放式问题
两年前整理了《AIGC算法工程师 面试八股文》,收到了很多小伙伴的催更。Diffusion的技术发展非常快,博主特意整理了最近两年最新的八股文,内容非常全面,涵盖算法八股文/工程八股文/开放式问题三个大类,希望能为求职的读者们带来帮助。
原文链接如下:https://blog.csdn.net/qq_41895747/article/details/144502642
本文摘抄部分问题,完整回答和问题请参考原文。
算法八股文
1、训练Diffusion Models的Loss有什么特别之处?
2、DiT模型中添加控制条件的方式有哪些?各有什么优缺点?
3、在Image-to-Image或Image-to-Video任务中,如何尽可能地保持住原始输入Image的特征?
4、简述SD3的原理,SD3和SD2.1/SDXL有哪些重要改进?
5、简述FLUX 和SD3的区别?
6、ReferenceNet和ControlNet在原理和应用场景上有哪些区别?
7、简单说一下Rectified Flow的原理,Rectified Flow相比于DDIM的优点?
8、请介绍一下现在Diffusion Models中常用的采样器,他们各自有什么特点?
9、现代的DiT模型中是否需要加RoPE?为什么?RoPE在其中的作用有哪些?
10、如何基于一个Text-to-Video的模型微调出Text+Image-to-Video的模型?
......
工程八股文
1、训练Diffusion Models的时候,当Loss收敛后是否意味着训练应该结束?
2、如何将代码迁移到Accelerate/DeepSpeed框架下?
3、如何在Accelerate框架中使用DeepSpeed?
4、DeepSpeed中Stage 1/Stage 2/Stage 3有哪些区别?
5、为什么有了Accelerate还需要DeepSpeed?
...
开放式问题
1、开放式问题:你认为自回归模型相比于DiT模型有哪些优势和缺点?
2、开放式问题:你认为Diffusion视频生成真的能理解物理规律吗?
3、开放式问题:你认为Diffusion Models最成功/最容易落地的业务场景有哪些?
4、开放式问题:你认为Diffusion Models领域最需要突破的问题是什么?
5、开放式问题:业务落地场景下如何更好的评估Diffusion Models的生成质量?
...
本文摘抄部分问题,完整回答和八股文请参考原文:AIGC算法工程师-面试八股文-2025年版本-算法八股文/工程八股文/开放式问题
专注探索Diffusion Models、Score-based Generative Models等深层生成式模型,持续更新分享最前沿技术。