字节日常实习大模型应用一面凉经

感觉面完人都通透了,还是太菜了,下去沉淀一下
1.项目拷打
2.讲一下Qwen架构
3.层归一化和RMS归一化的区别
4.lora 是怎么节省显存的
5.然后当场给了个场景,让我分别计算了一下全参和lora分别占多少显存
6.讲一下RAG
7.自注意力公式,为什么除根号dk
8.线性回归的损失函数是什么?逻辑回归的损失函数是什么?
9.逻辑回归损失函数为什么不能是MSE
10.softmax不同类别样本数量极不平衡时怎么办?
11.手撕了一个二分查找的题
全部评论
拼多多招27届实习生啦 https://careers.pddglobalhr.com/campus/intern/detail?t=dRvUVvcTiA
点赞 回复 分享
发布于 04-14 11:18 上海

相关推荐

评论
点赞
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务