字节LLM算法实习一面
发点面经攒攒人品
项目拷打
深度学习简答:
1. Transformer -> Attention公式,原理
2. Flash Attention原理
3. LN和BN的原理和区别
4. 常见的分类损失函数
5. 常见激活函数有哪些
6. ReLU公式,用法,存在的问题
7. 常见的回归损失函数
手撕代码
交换正整数的两位数字,使其尽可能大
给定一个N位、M进制的正整数,交换这个整数的两个数字(仅一次),使其尽可能大
项目拷打
深度学习简答:
1. Transformer -> Attention公式,原理
2. Flash Attention原理
3. LN和BN的原理和区别
4. 常见的分类损失函数
5. 常见激活函数有哪些
6. ReLU公式,用法,存在的问题
7. 常见的回归损失函数
手撕代码
交换正整数的两位数字,使其尽可能大
给定一个N位、M进制的正整数,交换这个整数的两个数字(仅一次),使其尽可能大
全部评论
相关推荐
小浪_Coding:工作只是谋生的手段 而不是相互比较和歧视 点赞 评论 收藏
分享
01-28 16:12
中南大学 Java
明天不下雨了:那我建议可以用 chatgpt atlas 或者 dia 去刷,也可以用 chrome 加个 ai 插件去刷 点赞 评论 收藏
分享
02-09 23:17
湖南大学 点赞 评论 收藏
分享
02-09 20:37
门头沟学院 Java 点赞 评论 收藏
分享
腾讯工作强度 939人发布