虾皮生成式推荐算法实习面经
给我面没招了,感觉自己好菜、面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.召回是怎么做的?
2.蒸馏教师模型能让学生模型达到接近教师模型的能力吗?
3.为什么大模型的推理总会有质量高的输出和质量低的输出?原理是什么
4.介绍transformer的结构,包括自注意力机制的公式,softmax是做什么的
5.BN和LN的区别是什么?
6.用的多大的模型?为什么要用这么大的模型,没考虑过资源消耗吗?
代码:非hot100的dfs
1.召回是怎么做的?
2.蒸馏教师模型能让学生模型达到接近教师模型的能力吗?
3.为什么大模型的推理总会有质量高的输出和质量低的输出?原理是什么
4.介绍transformer的结构,包括自注意力机制的公式,softmax是做什么的
5.BN和LN的区别是什么?
6.用的多大的模型?为什么要用这么大的模型,没考虑过资源消耗吗?
代码:非hot100的dfs
全部评论

感觉问的似乎不多啊
是上海的岗位吗?我之前也投这个,但被HR转岗到深圳的大模型应用算法岗了-搜推场景达人带货,下午HR面
相关推荐
查看10道真题和解析