首页
题库
公司真题
专项练习
面试题库
在线编程
面试
面试经验
AI 模拟面试
简历
求职
学习
课程
专栏·文章
竞赛
搜索
我要招人
发布职位
发布职位、邀约牛人
更多企业解决方案
在线笔面试、雇主品牌宣传
登录
/
注册
牛客344243631号
获赞
59
粉丝
16
关注
297
看过 TA
442
门头沟学院
2023
算法工程师
IP属地:辽宁
暂未填写个人简介
私信
关注
拉黑
举报
举报
确定要拉黑牛客344243631号吗?
发布(18)
刷题
牛客344243631号
04-25 20:45
算法工程师
美团算法求捞
美团一面到家大模型排序挂了,目前四天没动静。有没有大佬捞我一下
美团一面810人在聊
0
点赞
评论
收藏
转发
牛客344243631号
04-21 09:33
算法工程师
美团一面为什么那么久还不出结果
3.17下午一面,到现在一直没变是啥情况?为什么别人结果那么快就出了
美团一面810人在聊
0
点赞
评论
收藏
转发
牛客344243631号
04-10 00:06
算法工程师
百度挂了还能投吗
百度简历复筛挂了怎么投其他岗啊?还是说投不了了?
投递百度等公司10个岗位
0
点赞
评论
收藏
转发
牛客344243631号
04-08 14:51
已编辑
算法工程师
关于bn和ln
二面的时候面试官问我为什么transformer不用bn而是用ln。我看了几个网上的八股回答,结果面试官还是不满意,有没有懂哥讲一下啊? #nlp# #腾讯# 我的回答也是不同句子长度不一样,然后每个句子的位置不一样,可能是表达不大好,那个老东西不满意
0
点赞
评论
收藏
转发
牛客344243631号
04-03 15:08
算法工程师
腾讯二面
直接寄,30分钟速通,然后没手撕
腾讯二面453人在聊
腾讯工作体验
0
点赞
评论
收藏
转发
牛客344243631号
2023-10-03 15:53
算法工程师
双非美团一面
BN层作用:BN层是对输入进行操作,具体是求得均值和方差以后,每个数减去均值除以标准差。如果你对高斯分布还有印象,你会知道,我们在把高斯分布从某个分布转化为标准高斯分布的时候,用的也是这个公式。大多数情况,我们也会假设我们的数据是服从高斯分布的。所以这样的操作,其实就是把分布尽可能转化为同一个分布。那么为什么要把不同批次的输入,都转化为同一个分布呢?因为你不能保证你的每个数据都是同一个分布的(有噪声),同时,在网络还没收敛的时候,网络的每一层变化,也无法让每个数据都变成同一分布,(一个序列经过一个复杂函数变换以后,还能保证是同一个分布吗?)这里的每个数据指的是每一个batch。而一旦数据不是同...
投递美团等公司10个岗位 >
0
点赞
评论
收藏
转发
牛客344243631号
2023-09-07 22:19
算法工程师
SHEIN提前批NLP面试题目简析
1.Transformer的多头注意力的作用:从GCN的角度就是探索更多的权重矩阵。原文的解释是MultiHead-Attention 提供了多个“表示子空间”,可以使模型在不同位置上关注来自不同“表示子空间”的信息。 即通过MultiHead,模型可以捕捉到更加丰富的特征信息。这里的多个表示子空间其实就是GCN里的多个权重矩阵。2.无序数组的中位数:这道题应该算是本科算法课的入门题了,找中位数和找任意第k个数是一样的方法。方法一:快排一次后,检查k落在哪个区域,然后对那个区域再进行一次快排。如此反复,可得答案。方法二:同样使用快排,但是对基准数不再随机,而是尽可能找出让两段区域长度相等的划分...
投递SHEIN等公司10个岗位 >
如何判断面试是否凉了
我的求职思考
0
点赞
评论
收藏
转发
牛客344243631号
2023-09-06 23:54
算法工程师
旷视NLP--中科大硕士--面试题目简析
试题来自@ustc_zh 介绍lora,p-turing,各自优缺点 Lora是采用低秩矩阵分解的方式进行模型的微调,在transformer中,主要在wk,kq,wv,wo这四个矩阵中进行SVG分解,秩R是所设置的新的超参。 优点: 1)和原模型相比完全没有推理延时。 2)可插拔式的使用,可以快速针对不同的下游任务训练不同的lora权重(尝试过stable diffuion的不同LORA之后可以深刻的体会到它的优势) 3)低参数,适合小样本场景。 p-Turing是直接新增参数的方式进行的微调,在transformer中,主要在embedding层,wk,wv出拼接新的参数,以进行微调。 优...
投递中国科学技术大学等公司10个岗位 >
我的实习求职记录
我的求职思考
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-15 20:43
算法工程师
题解 | #列表的最值运算#
还是非常easy的 x=input().split() y=[] for i in x: y.append(int(i)) a=max(y) b=min(y) print(y) print(a) print(b)
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-15 20:14
算法工程师
题解 | #查字典#
没啥难度 x=input() y={'a': ['apple', 'abandon', 'ant'], 'b': ['banana', 'bee', 'become'], 'c': ['cat', 'come'], 'd': 'down'} for i in y[x]: print(i,end=' ')
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-15 18:31
算法工程师
题解 | #首都#
复习一下print的格式化输出 cities_dict={'Beijing': {'Capital': 'China'},'Moscow': {'Capital': 'Russia'},'Paris': {'Capital': 'France'}} a=sorted(cities_dict) for x in a: print('%s is the capital of %s!'%(x,cities_dict[x]['Capital']))
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-15 18:10
算法工程师
题解 | #毕业生就业调查#
松分体,没啥好说的 survey_list=['Niumei','Niu Ke Le','GURR','LOLO'] result_dict={'Niumei': 'Nowcoder','GURR': 'HUAWEI'} for x in survey_list: if x in result_dict: print('Hi, %s! Thank you for participating in our graduation survey!'%x) else: &...
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-14 20:51
算法工程师
题解 | #增加元组的长度#
num1=range(1,6) tuple1=tuple(num1) print(tuple1) print(len(tuple1)) num2=range(6,11) tuple2=tuple(num2) tuple3=tuple1+tuple2 print(tuple3) print(len(tuple3)) 栓条狗都写了
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-14 20:41
算法工程师
题解 | #名单中出现过的人#
元组的函数: if x in tuple: tuple=('Tom', 'Tony', 'Allen', 'Cydin', 'Lucy', 'Anna') name=input() print(tuple) if name in tuple: print('Congratulations!') else : print('What a pity!')
0
点赞
评论
收藏
转发
牛客344243631号
2022-08-14 20:38
算法工程师
题解 | #输出前三同学的成绩#
x=input().split()这个老知识点 然后元组的切片 x=input().split() y=tuple(x) print(y[0:3])
0
点赞
评论
收藏
转发
1
2
工具箱
TA的圈子
暂未加入圈子
TA的圈子
TA的笔记
暂无笔记
TA的笔记
登录
0
天
已登录
0
天
连续登录
0
人
今日访客
牛客网
牛客企业服务