小红书大模型算法一面 攒人品-暑期实习

发一下问题给大家参考,攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.项目拷打
2.主页精排模型的序列如何建模的
3.主页精排模型的样本是如何组织的,listwise和user level有什么区别
4.你迭代模型的最终版本的结构
5.tokenmixer上线了吗,没有收益的原因是为什么
6.介绍tokenmixer的结构
7.什么情况下tokenmixer会比mmcn、dcn有效;
8.为什么数据量足够的情况下,同参数量的情况下,tokenmixer的效果要更好;为什么tokenmixer的效率更好
9.八股提问
1.介绍几个序列建模的方法
2.din和transformer的各自的优势是什么,他们建模的本质差别是什么,他们的qkv有什么区别
3.transformer对序列建模具体是怎么做的
4.din的qkv和transformer的qkv都是从什么输入得到的
5.长序列直接入图的方法有什么,直接用transformer建模有什么问题
6.有什么降低时间复杂度的方法
7.线性注意力具体是什么方法,还有什么把注意力复杂度从平方减到线性的方法
手撕
写一个tokenmixer
得到最后的output怎么用,mean_pooling和sum_pooling有什么区别
pffn具体如何实现,mixup具体如何实现
全部评论

相关推荐

评论
点赞
收藏
分享

创作者周榜

更多
正在热议
更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务