阿里算法实习一面凉经-大模型广告生成

攒人品中,祝大家都能拿到满意的Offer!
1.项目拷打
2.transformer中FFN的作用,如果去掉FFN纯用注意力会怎么样?
3.batchnorm,layernorm和RMSNorm的区别和应用场景
4.pre norm和 post norm各自的优缺点
5.手撕:mid LeetCode 416. 分割等和子集
全部评论
考虑我司不 欢迎联系
点赞 回复 分享
发布于 今天 00:05 上海

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务