阿里云多模态算法面经

一面
介绍实习项目,岗位不匹配所以没有问生成相关的八股
1,用了什么优化器,介绍-下adam,adamW,相较SGD有什么改进
2,残差网络的作用是什么,什么叫做网络退化3,什么叫过拟合,过拟合的解决方案,在损失函数上过拟合是怎么体现的
4,Dropout的原理,预测的时候有没有什么补偿策略
5,lora的原理,如何初始化A,B矩阵,为什么
6,主流的位置编码,旋转位置编码的原理
5,了解强化学习吗
手撕 leetcode 33.搜索旋转排序数组
二面
主要关注数据是如何构建的,指标怎么评估,项目难点
八股:
1,Transformer的FFN层能不能去掉,为什么?
为什么是d-->4d?
2,attention中为什么要除以根号dk
3,SDXL和FLUX的区别
4,ControlNet对哪种控制条件效果更好,风格控制采用哪种方式
5,为什么分类损失不用KL散度而用交叉熵,二者区别是什么
手撕:rand7实现rand10
全部评论

相关推荐

1、项目,各种聊就行2、ViT的原理,swin-Transformer的原理,各自对比,他们的编码方式,是否可学习,各自优缺点,attention的区别和滑动方法;3、多模态VLM的不同模块的设计原理,attention原理,旋转位置编码原理4、手撕动态规划题目:给定一个三角形 triangle ,找出自顶向下的最小路径和。 每一步只能移动到下一行中相邻的结点上。相邻的结点 在这里指的是 下标 与 上一层结点下标 相同或者等于 上一层结点下标 + 1 的两个结点。也就是说,如果正位于当前行的下标 i ,那么下一步可以移动到下一行的下标 i 或 i + 1 。 示例 1: 输入:triangle = [[2],[3,4],[6,5,7],[4,1,8,3]] 输出:11 解释:如下面简图所示: 2 3 4 6 5 7 4 1 8 3 自顶向下的最小路径和为 11(即,2 + 3 + 5 + 1 = 11)。 示例 2: 输入:triangle = [[-10]] 输出:-10解题代码:# dp 三角def minimumSum(triangle):# top --downfor i in range(len(triangle)-2, -1, -1):# scane all elemfor j in range(len(triangle[i])):# current +=  下一行最小值triangle[i][j] += min(triangle[i+1][j], triangle[i+1][j+1])# top last就是return triangle[0][0]if __name__ == "__main__":triangle = [[2],[3,4],[6,5,7],[4,1,8,3]]print(minimumSum(triangle))triangle = [[-10]]print(minimumSum(triangle)
查看3道真题和解析
点赞 评论 收藏
分享
评论
1
7
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务