27实习抖音电商搜索算法一面
攒攒人品!有面试过同岗的朋友欢迎评论区交流
1. 介绍实习经历,围绕业务场景问
a. 怎么做PE,做到什么程度不做了
b. 针对这个场景怎么训模型
c. 如果模型输出不符合预期怎么办
d. 有没有加cot之类的内容
2. 手撕leetcode1227
一开始说的方法不太对,但面试官说条件概率是对的,然后引导想出正确解法。写出来之后追问复杂度,怎么改成O(n)复杂度
3. 八股
a. 描述一下attention
b. 多头注意力和普通注意力的区别,头之间有没有交互
c. 多头注意力的头数会不会影响参数量和计算量
d. 为什么现在都是decoder only的架构
e. 多轮对话场景下,encoder-decoder和decoder only有什么区别
f. kv cache,除了kv cache还有什么优化手段
g. 控制输出确定性的参数:temperature加在哪里,top-k top-p分别具体是什么
1. 介绍实习经历,围绕业务场景问
a. 怎么做PE,做到什么程度不做了
b. 针对这个场景怎么训模型
c. 如果模型输出不符合预期怎么办
d. 有没有加cot之类的内容
2. 手撕leetcode1227
一开始说的方法不太对,但面试官说条件概率是对的,然后引导想出正确解法。写出来之后追问复杂度,怎么改成O(n)复杂度
3. 八股
a. 描述一下attention
b. 多头注意力和普通注意力的区别,头之间有没有交互
c. 多头注意力的头数会不会影响参数量和计算量
d. 为什么现在都是decoder only的架构
e. 多轮对话场景下,encoder-decoder和decoder only有什么区别
f. kv cache,除了kv cache还有什么优化手段
g. 控制输出确定性的参数:temperature加在哪里,top-k top-p分别具体是什么
全部评论
相关推荐
查看7道真题和解析 点赞 评论 收藏
分享