字节LLM算法实习一面
发点面经攒攒人品
项目拷打
深度学习简答:
1. Transformer -> Attention公式,原理
2. Flash Attention原理
3. LN和BN的原理和区别
4. 常见的分类损失函数
5. 常见激活函数有哪些
6. ReLU公式,用法,存在的问题
7. 常见的回归损失函数
手撕代码
交换正整数的两位数字,使其尽可能大
给定一个N位、M进制的正整数,交换这个整数的两个数字(仅一次),使其尽可能大
项目拷打
深度学习简答:
1. Transformer -> Attention公式,原理
2. Flash Attention原理
3. LN和BN的原理和区别
4. 常见的分类损失函数
5. 常见激活函数有哪些
6. ReLU公式,用法,存在的问题
7. 常见的回归损失函数
手撕代码
交换正整数的两位数字,使其尽可能大
给定一个N位、M进制的正整数,交换这个整数的两个数字(仅一次),使其尽可能大
全部评论
接好运
蹲后续结果
这面经攒的人品够买一张彩票了,祝楼主offer速来!
相关推荐
查看10道真题和解析 点赞 评论 收藏
分享
