27实习腾讯视觉大模型一面
1.实习介绍
2.DP和DDP区别
3.介绍Qwen-lmaget
4.wan2.1、wan2.2、cogvideox.hunyuan的结构差异?你觉得哪个结构更好?
5.LORA一般加到哪?rank设置有没有技巧
6.人脸编辑模型的数据清洗怎么做的?怎么确保的良品率和误杀率?在什么样的机器上进行的
7.你认为决定现在基模能力的方面有哪些?
8.Deepspeed的三阶段zero简单介绍一下
9.手撕:casual-selfAttention
2.DP和DDP区别
3.介绍Qwen-lmaget
4.wan2.1、wan2.2、cogvideox.hunyuan的结构差异?你觉得哪个结构更好?
5.LORA一般加到哪?rank设置有没有技巧
6.人脸编辑模型的数据清洗怎么做的?怎么确保的良品率和误杀率?在什么样的机器上进行的
7.你认为决定现在基模能力的方面有哪些?
8.Deepspeed的三阶段zero简单介绍一下
9.手撕:casual-selfAttention
全部评论
相关推荐
hoop~0718:建议入职先买“电脑磕碰险”呗
点赞 评论 收藏
分享
12-09 00:19
清华大学 Java Yilena:项目写的太差了,而且这两个项目也很杂,agent方面我不太了解,但对于后端来说这两个项目竞争力感觉不如烂大街项目。
我觉得首要之急是解决你到底是想搞toc/tob还是agent
点赞 评论 收藏
分享


查看16道真题和解析