番茄大模型暑期实习面经

1. 自我介绍
2. 详细讲一下实习业务,亮点在哪里,提升在哪里
3.介绍一下双塔模型
4.训练双塔模型时,怎么处理正负样本不均衡。欠采样的方法有哪些
5. 介绍一下常用于推荐的序列模型
6.Transformer用的归一化函数?
7.为什么语言模型不能使用batch norm?Batch norm和Layer norm的区别是什么?
8. Transfomer能用来作为序列模型吗? 但是为什么transfomer不常用于精排呢?
9. Transformer和din的参数差异,计算复杂度的区别?
10. 介绍一下传统序列模型和transformer的区别?
代码:一道hard的动态规划
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论

相关推荐

不愿透露姓名的神秘牛友
昨天 10:38
实力求职者:真的绷不住了,第一张霸总人设,第二张求生欲拉满
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
点赞
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务