阿里云多模态算法面经

一面
介绍实习项目,岗位不匹配所以没有问生成相关的八股
1,用了什么优化器,介绍-下adam,adamW,相较SGD有什么改进
2,残差网络的作用是什么,什么叫做网络退化3,什么叫过拟合,过拟合的解决方案,在损失函数上过拟合是怎么体现的
4,Dropout的原理,预测的时候有没有什么补偿策略
5,lora的原理,如何初始化A,B矩阵,为什么
6,主流的位置编码,旋转位置编码的原理
5,了解强化学习吗
手撕 leetcode 33.搜索旋转排序数组
二面
主要关注数据是如何构建的,指标怎么评估,项目难点
八股:
1,Transformer的FFN层能不能去掉,为什么?
为什么是d-->4d?
2,attention中为什么要除以根号dk
3,SDXL和FLUX的区别
4,ControlNet对哪种控制条件效果更好,风格控制采用哪种方式
5,为什么分类损失不用KL散度而用交叉熵,二者区别是什么
手撕:rand7实现rand10
全部评论

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务