美的-NLP/大模型一面面经

📍面试公司:美的
👜面试岗位:NLP/大模型
📖面试问题:
1. 介绍bert
2. 因项目中用到了bert+crf,问了两者用到学习率是否一样?为什么不一样?
3. crf的转移矩阵和发射矩阵是什么?计算公式和计算结果是什么?
4. 大模型微调怎么做的?
5. Qwen的位置编码是怎么做的(rope和YaRN)
6. rope是加上去的还是乘上去的?bert的呢
7. rope是怎么应用在超出长度限制的输入上的,bert的位置编码可以用到超出长度限制的输入上吗
8. 如果大模型输入是4k长度,可以输出8k的长度输出吗
9. lora可以用在哪些地方?为什么可以用在ffn层?为什么作者一开始先用在q,k,v,o的权重矩阵上?
10. 如何理解低秩状态?
11. 在资源受限制的情况下(不能分布式),有10亿条数据,原本需要训练10亿次,怎么做能够减少训练次数,比如训练6-7亿次?这题不太明白,只回答了一个梯度累积

其他是一些项目问题
反问:
业务内容,岗位能力交叉性
🙌面试体验:已经无力,攒攒人品
#算法岗面试##算法面经#
全部评论

相关推荐

查看13道真题和解析
点赞 评论 收藏
分享
08-25 23:34
门头沟学院 Java
放暑假后,找了第一段实习,居然问了一些八股文知识就通知上班了。盲猜差打杂的,还真是聪明,flag立的飞起。早九晚六的生活治好了我放假睡懒觉的习惯,因为要早起,倒逼早睡。在公司,好像大家都有自己的事情要忙,他们对于小小实习生若有若无,无暇顾及,实属正常不过了。公司里面已经有成熟的项目落地,更多的需要运维工作,修Bug,给项目经理写操作手册,测试模块功能,额,没学,问了三次都没人回应,算了开摆。期间提过两次问这边有没有项目可以接手或者是写客户的新需求,没有的事,有的是无尽的Bug,这简单的改完了,难的也难受,也佩服自己,尝试着投递百度客户端,快手的社招测试岗位,在一面的时候,切实感受到大厂需要的是一个有扎实的专业课基础和表达抽象能力,百度居然没让手撕代码,反正力扣一道没刷;快手社招的是一位大姐姐,捣鼓电脑麦克风都让我自乱阵脚五分钟,到头来手机微信电话,屏幕视频,可我还是低估了社招的标准,一上来不问基础知识,询问项目里面当正常程序运行出现异常,我知道你项目网上劈天盖地,我也能问你,当出现异常,你该怎么解决,有没有自己实现的demo,这一次社招对于人的考验确实有点猛烈了;所以后面都没有勇气去面字节的后端生活服务,了解到手撕代码挂基本没戏,更何况HR说4面,我的天,实习岗位整出来了4面,无所谓,对于我不会的统统推掉。最后一周人就老老实实的了,面试前确实压力很大,因为对大公司的向往与自身一言难尽的水平,程序员的最终幻想了。公司好像确实养老,一天天没有什么事情,坐在那里划划水,偶尔主管过来看看,看完继续划划水,挺无聊的,但确实让自己看清楚一些社会的现实,学校的环境真的对人太友好了,只照顾好自己的生活和学习,不用考虑领导、租房、工作压力、上班的孤独。以后会更加勇敢、自信、热爱生活
实习教会我的事
点赞 评论 收藏
分享
评论
1
11
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务