27实习腾讯视觉大模型一面
1.实习介绍
2.DP和DDP区别
3.介绍Qwen-lmaget
4.wan2.1、wan2.2、cogvideox.hunyuan的结构差异?你觉得哪个结构更好?
5.LORA一般加到哪?rank设置有没有技巧
6.人脸编辑模型的数据清洗怎么做的?怎么确保的良品率和误杀率?在什么样的机器上进行的
7.你认为决定现在基模能力的方面有哪些?
8.Deepspeed的三阶段zero简单介绍一下
9.手撕:casual-selfAttention
2.DP和DDP区别
3.介绍Qwen-lmaget
4.wan2.1、wan2.2、cogvideox.hunyuan的结构差异?你觉得哪个结构更好?
5.LORA一般加到哪?rank设置有没有技巧
6.人脸编辑模型的数据清洗怎么做的?怎么确保的良品率和误杀率?在什么样的机器上进行的
7.你认为决定现在基模能力的方面有哪些?
8.Deepspeed的三阶段zero简单介绍一下
9.手撕:casual-selfAttention
全部评论
相关推荐

查看13道真题和解析