抖音大模型|社招3轮面经
1️⃣抖音一面
1、聊项目。
2、AUC的两种公式是?你能证明这两种等价的吗?
3、BERT-CRF中,为什么要加CRF?好处是?
4、self-attention为什么要用QKV三个矩阵,不用有什么问题?有没有哪个模型的Q和K矩阵是一样的?
5、reinforce属于on-policy还是off-policy?为什么?
6、reinforce带上baseline好处是?reinforce的loss写一下?
7、策略梯度会推导吗?简单写一下?
8、代码题(代码题一般别着急写,先跟面试官说下思路,确定了再写):lc 46,全排列(lc表示leetcode,下同)。lc 73,矩阵置0。
2️⃣抖音二面
1、介绍项目。
2、知识蒸馏有哪几种?你觉得哪种效果最好?
3、nlp的数据增强方法,主要有哪几种?每一种举个例子?
4、分类的损失函数为什么是交叉熵而不是mse?
5、BERT对输入文本的长度有什么限制,为什么要限制长度呢?
6、BigBird里面有哪几种注意力机制?相比原始transformer的self-attention的优势?
7、场景题:如何根据拼多多的商品数量,估计淘宝的商品数量?
8、给出emb_size, max_len, vocab_size, ff_inner_size,num_heads, 12层,求BERT参数量。
9、代码题:n皇后问题。
3️⃣抖音三面
1、简单聊项目。
2、CRF和HMM区别?CRF为什么比HMM效果好?
3、如果BERT词表很大,比如vocab_size达到几百万,怎么办?
4、快速手写一些transformer的mha(多头注意力),伪代码意思一下就行。
5、为什么对比学习中,temperature很小,而知识蒸馏的temperature比较大?
6、你觉得在抖音买东西,和淘宝、拼多多他们的区别是?(我没在抖音买过,就只能现场编。)
7、你最近看到过哪些paper?简单介绍下?
8、你觉得自己有那些优缺点?平时喜欢怎么缓解压力?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
1、聊项目。
2、AUC的两种公式是?你能证明这两种等价的吗?
3、BERT-CRF中,为什么要加CRF?好处是?
4、self-attention为什么要用QKV三个矩阵,不用有什么问题?有没有哪个模型的Q和K矩阵是一样的?
5、reinforce属于on-policy还是off-policy?为什么?
6、reinforce带上baseline好处是?reinforce的loss写一下?
7、策略梯度会推导吗?简单写一下?
8、代码题(代码题一般别着急写,先跟面试官说下思路,确定了再写):lc 46,全排列(lc表示leetcode,下同)。lc 73,矩阵置0。
2️⃣抖音二面
1、介绍项目。
2、知识蒸馏有哪几种?你觉得哪种效果最好?
3、nlp的数据增强方法,主要有哪几种?每一种举个例子?
4、分类的损失函数为什么是交叉熵而不是mse?
5、BERT对输入文本的长度有什么限制,为什么要限制长度呢?
6、BigBird里面有哪几种注意力机制?相比原始transformer的self-attention的优势?
7、场景题:如何根据拼多多的商品数量,估计淘宝的商品数量?
8、给出emb_size, max_len, vocab_size, ff_inner_size,num_heads, 12层,求BERT参数量。
9、代码题:n皇后问题。
3️⃣抖音三面
1、简单聊项目。
2、CRF和HMM区别?CRF为什么比HMM效果好?
3、如果BERT词表很大,比如vocab_size达到几百万,怎么办?
4、快速手写一些transformer的mha(多头注意力),伪代码意思一下就行。
5、为什么对比学习中,temperature很小,而知识蒸馏的temperature比较大?
6、你觉得在抖音买东西,和淘宝、拼多多他们的区别是?(我没在抖音买过,就只能现场编。)
7、你最近看到过哪些paper?简单介绍下?
8、你觉得自己有那些优缺点?平时喜欢怎么缓解压力?
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
相关推荐
点赞 评论 收藏
分享
昨天 21:03
广东财经大学 海外市场 点赞 评论 收藏
分享