字节LLM算法实习一面

发点面经攒攒人品
项目拷打
深度学习简答:
1. Transformer -> Attention公式,原理
2. Flash Attention原理
3. LN和BN的原理和区别
4. 常见的分类损失函数
5. 常见激活函数有哪些
6. ReLU公式,用法,存在的问题
7. 常见的回归损失函数
手撕代码
交换正整数的两位数字,使其尽可能大
给定一个N位、M进制的正整数,交换这个整数的两个数字(仅一次),使其尽可能大
全部评论
接好运
点赞 回复 分享
发布于 昨天 16:20 湖北
蹲后续结果
点赞 回复 分享
发布于 昨天 16:20 福建
这面经攒的人品够买一张彩票了,祝楼主offer速来!
点赞 回复 分享
发布于 昨天 16:20 北京

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务