字节日常实习大模型应用一面凉经
感觉面完人都通透了,还是太菜了,下去沉淀一下
1.项目拷打
2.讲一下Qwen架构
3.层归一化和RMS归一化的区别
4.lora 是怎么节省显存的
5.然后当场给了个场景,让我分别计算了一下全参和lora分别占多少显存
6.讲一下RAG
7.自注意力公式,为什么除根号dk
8.线性回归的损失函数是什么?逻辑回归的损失函数是什么?
9.逻辑回归损失函数为什么不能是MSE
10.softmax不同类别样本数量极不平衡时怎么办?
11.手撕了一个二分查找的题
1.项目拷打
2.讲一下Qwen架构
3.层归一化和RMS归一化的区别
4.lora 是怎么节省显存的
5.然后当场给了个场景,让我分别计算了一下全参和lora分别占多少显存
6.讲一下RAG
7.自注意力公式,为什么除根号dk
8.线性回归的损失函数是什么?逻辑回归的损失函数是什么?
9.逻辑回归损失函数为什么不能是MSE
10.softmax不同类别样本数量极不平衡时怎么办?
11.手撕了一个二分查找的题
全部评论
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
相关推荐
查看11道真题和解析