首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
基础学习课
实战项目课
求职辅导课
专栏&文章
竞赛
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
AI面试、笔试、校招、雇品
HR免费试用AI面试
最新面试提效必备
登录
/
注册
在抱佛脚的斑马很不想上网课
广东工业大学 自然语言处理
发布于广东
关注
已关注
取消关注
@牛客344243631号:
SHEIN提前批NLP面试题目简析
1.Transformer的多头注意力的作用:从GCN的角度就是探索更多的权重矩阵。原文的解释是MultiHead-Attention 提供了多个“表示子空间”,可以使模型在不同位置上关注来自不同“表示子空间”的信息。 即通过MultiHead,模型可以捕捉到更加丰富的特征信息。这里的多个表示子空间其实就是GCN里的多个权重矩阵。2.无序数组的中位数:这道题应该算是本科算法课的入门题了,找中位数和找任意第k个数是一样的方法。方法一:快排一次后,检查k落在哪个区域,然后对那个区域再进行一次快排。如此反复,可得答案。方法二:同样使用快排,但是对基准数不再随机,而是尽可能找出让两段区域长度相等的划分。(把原来的数组分成五份,然后找中位数,然后再在这些中位数里找出中位数作为基准)(记得笔试完了看答案)3.一个元素在一个有序数组的第一次出现位置?简单点就是遍历一遍,快一点就是二分搜索。不过这道题要手写,二分的细节会多一点,不知道原答主选择哪一种解法。PS:find函数应该不让用的吧。4.blip2的架构,优势和之前多模态模型的区别?blip2是图像-语言多模态模型的预训练方法。这个架构是2023年才提出的,也看出来面试紧跟时事了。blip2的一个常见模式是输入一张图片,输出这张图片的描述。bilp2是在冻结的图像模型(负责从图像中提取特征,比如vit)和冻结的语言模型(负责生成语言)中间放入一个Q-Former,我们的目标就是训练这个Q-Former。Q-Former包含图像Transformer和语言Transformer,图像Transformer包含CA和SA,SA和语言Transformer共享参数,CA只接受图像模型提取的图像特征,图像模型的输入是一个查询值,这个查询值将在SA中和自己交互,在CA中和图像特征交互。最后图像Transformer输出一个综合图像特征的向量,同时语言Transformer输入一个文本,进行encode,得到一个文本的向量。然后根据具体的任务选择不同的方式对这两个向量进行操作。最后,Q-former把得到的向量传给冻结的语言模型。语言Transformer训练的时候做解码器,预测的时候是解码器。训练的时候先训练Q-Former和图像模型的交互,然后把Q-Former的结果和语言模型连接(中间可以加入全连接,前缀词等操作)。如下图5.知识蒸馏和无监督样本训练?知识蒸馏是利用大模型把一个大模型的知识压缩到一个小模型上。具体来说你在一个训练集上得到了一个非常好的较大的模型,然后你把这个模型冻结,作为Teacher模型也叫监督模型,然后你再造一个较小参数的模型叫做Student模型,我们的目标就是利用冻结的Teacher模型去训练Student模型。A.离线蒸馏:Student在训练集上的loss和与Teacher模型的loss作为总的loss,一起优化。B.半监督蒸馏:向Teacher模型输入一些input得到标签,然后把input和标签传给Student模型还有个自监督蒸馏,直接不要Teacher模型,在最后几轮epoch,把前面训练好的模型作为Teacher进行监督。目前知识蒸馏的一个常见应用就是对齐ChatGPT。然后这个无监督样本训练,我看不懂意思。如果是传统的无监督学习,那就是聚类,主成分分析等操作。如果是指知识蒸馏的话,就是离线蒸馏的方式,只不过损失只有和Teacher的loss。6.在电商领域微调?额,这个问题我也不知道,比较没有工程经验。简单一点的话就是提示词微调,复杂一点的话就是搞个数据集然后再进行微调。收集一些客服聊天记录,营销广告,好评,差评等数据作为训练集。具体微调方法就看训练集大小,原模型大小来选择了。以上。最后更正一下,原答主是中科大本科,不是硕士,在此做出更正。
点赞 5
评论 0
全部评论
推荐
最新
楼层
暂无评论,快来抢首评~
相关推荐
07-17 00:07
已编辑
阿里巴巴_大模型算法工程师
大模型面经 - 快手快 Star
面试经验分享
点赞
评论
收藏
分享
07-16 13:49
苏州大学 集成电路IC设计
世界就是个巨大的草台班子
我本科是电子信息工程专业的,第一次实习面试通过的时候,当时激动地睡不着,那天晚上还在学习linux、指针等知识,想着我这个嵌入式岗位过去,是不是要开始接触项目,然后进行开发,还担心自己做不出来,被压力。到了那边,在开始几天的时候,基本上就是没啥事情,让你先了解下产品,看看好不好用,几十万的一个主机加从机,就隔着在那测pps、ttl、还有检测各种板卡,类似管理卡、钟卡等等,顶多就是烧录下程序,测试下功能。到后面才知道,基本研发工作是北京那边负责,我们这边无非就是看一点懂代码,然后调调参,大事没有,小事情不断,后面觉得根本学不到东西,就离职了,哈哈。
码农索隆:
工作就是那么回事,害
你以为的实习VS真实的实...
点赞
评论
收藏
分享
06-11 12:35
合肥工业大学 Java
27暑期日常太难找了
楼主爆肝五个月,算法八股技术栈项目都达到了现阶段暂时的瓶颈,本来下定决心暑假实习的,可是投出去的简历全都杳无音讯一个面试也没有😭😭😭最后还找不到的话不知道该找小小厂还是回去接着沉淀
牛客刘北:
如果暑期实习是27届的话,你要晚一年才会毕业,企业为什么会等你呢?要搞清时间逻辑呀!27届现在实习只能是在暑假实习,这是日常实习,不是暑期实习。所以多去投日常实习吧,暑期实习肯定不会要你的
点赞
评论
收藏
分享
06-26 16:46
广东海洋大学 Java
牛友们为什么我的简历投出去看都没人看双飞java毕业真的只能送外卖了吗
程序员小白条:
找的太晚,别人都是大三实习,然后大四秋招春招的,你大四下了才去实习,晚1年
点赞
评论
收藏
分享
昨天 12:03
西南交通大学 golang
滴滴提前批
被挂麻了话说这推荐转岗怎么还给我多报了一个不是说提前批只能投递一个吗
投递滴滴等公司10个岗位
点赞
评论
收藏
分享
评论
点赞成功,聊一聊 >
点赞
收藏
分享
评论
提到的真题
返回内容
全站热榜
更多
1
...
滴滴提前批面经
7402
2
...
20250716 - 百度 - 后端开发 - 一面
6749
3
...
实习,你就这么偷
6609
4
...
27届前端七月找实习记录
5986
5
...
我曾经以为自己熬过了三阶段已经无敌,但现在却见证了逆天的第四阶段
4249
6
...
如何平衡暑期实习与秋招
4025
7
...
关于牛土兵教育割韭菜的事实
3965
8
...
从中山大学到中兴 SSP:我的秋招打怪升级之路
3693
9
...
Momenta26实习
3588
10
...
滴滴提前批凉经(一面,二面)
3374
创作者周榜
更多
正在热议
更多
#
不卡学历的大厂有哪些?
#
7122次浏览
60人参与
#
百度秋招提前批进度
#
108594次浏览
1148人参与
#
实习如何「偷」产出?
#
13600次浏览
171人参与
#
除了主业以外,你还有哪些其他收入?
#
3042次浏览
55人参与
#
实习打杂,要跑路吗
#
7708次浏览
97人参与
#
风评不好的公司,你会去吗?
#
40809次浏览
269人参与
#
校园里的破防时刻
#
4725次浏览
50人参与
#
职场新人体验
#
9489次浏览
98人参与
#
为什么那么多公司毁约
#
181044次浏览
1339人参与
#
蔚来求职进展汇总
#
92806次浏览
769人参与
#
第一份工作应该选高薪还是热爱?
#
77154次浏览
746人参与
#
一人推荐一个值得去的通信/硬件公司
#
188158次浏览
1867人参与
#
设计人如何选offer
#
127352次浏览
748人参与
#
考研可以缓解求职焦虑吗
#
52758次浏览
470人参与
#
学历贬值真的很严重吗?
#
27633次浏览
186人参与
#
腾讯求职进展汇总
#
953067次浏览
9573人参与
#
秋招结束之后的日子
#
77542次浏览
941人参与
#
你觉得现在还能进互联网吗?
#
16513次浏览
178人参与
#
你觉得早上几点上班合适?
#
74363次浏览
308人参与
#
24届软件开发秋招薪资爆料
#
355841次浏览
1229人参与
牛客网
牛客网在线编程
牛客网题解
牛客企业服务