SHEIN提前批NLP面试题目简析

1.Transformer的多头注意力的作用:

从GCN的角度就是探索更多的权重矩阵。原文的解释是MultiHead-Attention 提供了多个“表示子空间”,可以使模型在不同位置上关注来自不同“表示子空间”的信息。 即通过MultiHead,模型可以捕捉到更加丰富的特征信息。这里的多个表示子空间其实就是GCN里的多个权重矩阵。

2.无序数组的中位数:

这道题应该算是本科算法课的入门题了,找中位数和找任意第k个数是一样的方法。

方法一:快排一次后,检查k落在哪个区域,然后对那个区域再进行一次快排。如此反复,可得答案。

方法二:同样使用快排,但是对基准数不再随机,而是尽可能找出让两段区域长度相等的划分。(把原来的数组分成五份,然后找中位数,然后再在这些中位数里找出中位数作为基准)

(记得笔试完了看答案)

3.一个元素在一个有序数组的第一次出现位置?

简单点就是遍历一遍,快一点就是二分搜索。不过这道题要手写,二分的细节会多一点,不知道原答主选择哪一种解法。

PS:find函数应该不让用的吧。

4.blip2的架构,优势和之前多模态模型的区别?

blip2是图像-语言多模态模型的预训练方法。这个架构是2023年才提出的,也看出来面试紧跟时事了。

blip2的一个常见模式是输入一张图片,输出这张图片的描述。

bilp2是在冻结的图像模型(负责从图像中提取特征,比如vit)和冻结的语言模型(负责生成语言)中间放入一个Q-Former,我们的目标就是训练这个Q-Former。Q-Former包含图像Transformer和语言Transformer,图像Transformer包含CA和SA,SA和语言Transformer共享参数,CA只接受图像模型提取的图像特征,图像模型的输入是一个查询值,这个查询值将在SA中和自己交互,在CA中和图像特征交互。最后图像Transformer输出一个综合图像特征的向量,同时语言Transformer输入一个文本,进行encode,得到一个文本的向量。然后根据具体的任务选择不同的方式对这两个向量进行操作。最后,Q-former把得到的向量传给冻结的语言模型。语言Transformer训练的时候做解码器,预测的时候是解码器。

训练的时候先训练Q-Former和图像模型的交互,然后把Q-Former的结果和语言模型连接(中间可以加入全连接,前缀词等操作)。如下图

5.知识蒸馏和无监督样本训练?

知识蒸馏是利用大模型把一个大模型的知识压缩到一个小模型上。具体来说你在一个训练集上得到了一个非常好的较大的模型,

然后你把这个模型冻结,作为Teacher模型也叫监督模型,然后你再造一个较小参数的模型叫做Student模型,我们的目标就是利用冻结的Teacher模型去训练Student模型。

A.离线蒸馏:Student在训练集上的loss和与Teacher模型的loss作为总的loss,一起优化。

B.半监督蒸馏:向Teacher模型输入一些input得到标签,然后把input和标签传给Student模型

还有个自监督蒸馏,直接不要Teacher模型,在最后几轮epoch,把前面训练好的模型作为Teacher进行监督。

目前知识蒸馏的一个常见应用就是对齐ChatGPT。

然后这个无监督样本训练,我看不懂意思。如果是传统的无监督学习,那就是聚类,主成分分析等操作。如果是指知识蒸馏的话,就是离线蒸馏的方式,只不过损失只有和Teacher的loss。

6.在电商领域微调?

额,这个问题我也不知道,比较没有工程经验。简单一点的话就是提示词微调,复杂一点的话就是搞个数据集然后再进行微调。

收集一些客服聊天记录,营销广告,好评,差评等数据作为训练集。具体微调方法就看训练集大小,原模型大小来选择了。

以上。最后更正一下,原答主是中科大本科,不是硕士,在此做出更正。

#如何判断面试是否凉了##我的求职思考##23届找工作求助阵地##nlp##算法入门#
全部评论

相关推荐

头像
04-23 19:11
已编辑
民办三本 计算机类
1. 手写线程池(线下白纸上手写,因为我简历上写了精通线程池,能够手写源码,然后手撕了20min,写完了)2. 为什么getTask()不直接take(因为我白纸上涂改了这个地方)3. 线程池中线程超时是怎么实现的4. 线程池的业务场景5. 商详异步并发查询的参数怎么调优的6. 假设商详4c8g 5个接口并发异步查询 接口耗时100ms,用纸手算最佳线程池参数(手算真的尬住了)7. dubbo和feign的区别底层原理8. springboot底层是怎么接收请求的(源码,怎么启动tomcat)9. 结合计算机网络讲一下怎么建立连接的10. 代码里没有明确三次握手四次这个动作,是蕴含在那部分的11. 讲一下三次握手四次挥手(协商内容,比如tcp数据部分长度,滑动窗口大小等)12. 讲一下实习的时候用过的设计模式,结合业务场景(策略/模版)13. 结合spring,讲一下你平时用到了spring的哪些扩展特性,为什么用了这个(我讲了我手写rpc,init启动netty服务端)14. 你的毕业设计题目(学校官网系统....我说老师不让我改,本来我是打车)15. 面试官笑了(原话: 但你们现在出来应聘不自己手撕个rpc都不好意思说,现在更新换代也快,过几年你们人手都手撕大模型了都 , 然后我回答: 手写chatgpt (笑了) )16. 最后问了我offer情况 (结束了,然后和hr聊了半天)17. PS: 直接根hr说我是得物最强实习生,面试通过率100%,手里全是15*15的offer,现在在等一个大厂的面试
查看15道真题和解析
点赞 评论 收藏
转发
5 27 评论
分享
牛客网
牛客企业服务