虾皮生成式推荐算法实习面经

给我面没招了,感觉自己好菜、面试很难,还是要多多练习,感觉自己说不明白业务逻辑
1.召回是怎么做的?
2.蒸馏教师模型能让学生模型达到接近教师模型的能力吗?
3.为什么大模型的推理总会有质量高的输出和质量低的输出?原理是什么
4.介绍transformer的结构,包括自注意力机制的公式,softmax是做什么的
5.BN和LN的区别是什么?
6.用的多大的模型?为什么要用这么大的模型,没考虑过资源消耗吗?
代码:非hot100的dfs
全部评论
感觉问的似乎不多啊
点赞 回复 分享
发布于 03-13 23:00 北京
是上海的岗位吗?我之前也投这个,但被HR转岗到深圳的大模型应用算法岗了-搜推场景达人带货,下午HR面
点赞 回复 分享
发布于 03-12 12:11 台湾

相关推荐

评论
1
1
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务