京东三面面经

1. 自我介绍

2. transformer中softmax的作用?不做softmax会有什么问题?Softmax怎么解决上下溢的问题?除了减去最大值还有方法?
3. selfattention 和传统attention 的区别?为什么Q K矩阵要不一样?Q K相同会怎么样?
4. BERT的CLS token的作用?这个CLS在下游分类任务的效果不好,有什么不用CLS的改进方法吗?用BERT做分类如何更好表达句子含义?BERT的输出有几种?对应BERT中的哪两个函数?BERT当中哪些计算是线性的哪些是非线性的?BERT是怎么区分一词多义的?
5. 学习率warmup的用法和作用?解释梯度消失的原因和解决方法,Dropout可以解决梯度消失吗?
6. BERT和GPT各自结构的优势?如果大模型以后部署、速度都得到了很大的提升,BERT会被取代吗?
7. GBDT和随机森林的区别?各自的方法流程?各自的数据处理的特点?各自偏向于解决什么问题?GBDT和随机森林对异常值的敏感程度?随机森林随机体现在哪些地方?
8. 讲一下BN和LN,Transformer问什么不用BN?
9. LORA微调的目的?LORA可以增加领域知识吗?LORA矩阵初始化?两个矩阵的初始化反过来会怎么样?LORA微调的超参?
10. LLM复读机问题以及解决方法有哪些?怎么抑制LLM的幻觉问题?常用的位置编码有哪些? 一些对原始attention的改进有哪些?
11. 为什么要用多头注意力?多头的思想和QKV三个不同投影矩阵的思想的异同?QKV矩阵除了增加表达能力以外还有什么作用?(不太懂问的是啥,面试官后面提示说是还有降维的作用,不是很懂)类似多头的集成的思想在什么算法里面比较常见?(我答了机器学习的集成学习类,比如前面的随机森林,还说了MOE这种,面试官比较想听到的是多尺度CNN)

修改了一些内容,恢复开放了,之前热度太高有点😨

#京东求职进展汇总# #软件开发笔面经#
全部评论
八股仙人
13 回复 分享
发布于 2024-09-10 20:22 北京
没绷住,和我完全一样的面经,我也今天面的,晚上就挂了
6 回复 分享
发布于 2024-09-10 23:40 上海
已经能感受到面试的时候的窒息感了
5 回复 分享
发布于 2024-09-10 20:45 广东
这八股也太炸裂了😂
4 回复 分享
发布于 2024-09-10 20:32 安徽
😂你这nlp岗含金量妥妥拉满啊😂
3 回复 分享
发布于 2024-09-11 00:17 陕西
https://zhuanlan.zhihu.com/p/360343071
2 回复 分享
发布于 2024-09-10 20:53 北京
请教一下,lora两个矩阵的初始化反过来会怎么样?答案应该是怎样的呢
点赞 回复 分享
发布于 2024-10-13 15:13 上海
woc,传统算法现在也常问么😱
点赞 回复 分享
发布于 2024-09-30 21:12 安徽
有点像KPI,是不对口吗,为啥项目没问?
点赞 回复 分享
发布于 2024-09-20 16:43 辽宁
请问一下是什么部门呀
点赞 回复 分享
发布于 2024-09-20 09:41 辽宁
难死了
点赞 回复 分享
发布于 2024-09-11 15:12 江苏
人傻了
点赞 回复 分享
发布于 2024-09-11 14:48 北京
佬,时间线可以说一下吗
点赞 回复 分享
发布于 2024-09-10 20:35 北京

相关推荐

07-03 11:02
门头沟学院 Java
屋顶的闪闪星光:如果过去只有两段小厂实习,那我觉得可以去七牛。 一个是还算知名企业。再一个,go这种非主流有他的好处,市场竞争没有那么白热化,同样的履历,go拿到的公司大概率会比Java要好一截。 再有问题私信交流
投递七牛云等公司10个岗位
点赞 评论 收藏
分享
面试节奏共四面,6.11一面,6.16二面,6.18三面,6.20hr面,6.24oc面经一面主要是八股盛宴和项目拷打,基本都回答出,实习经历没问两道手撕开胃菜:三数之和和回文子串八股spring,mysql,redis,mq都有spring部分:spring原理,设计模式并且举例,循环依赖怎么解决,为什么需要三级缓存mysql:索引结构,b树和二叉树平衡树的区别,为什么使用b树,介绍下mysql的锁,有哪些隔离模式以及怎么实现的,mmvc是什么怎么实现的,mysql有哪些日志以及作用redis:主要结合简历上的项目提问,点赞,收藏和排行榜单功能在redis里面怎么设计的以及为什么这么设计,为什么使用hash不用zset,zset底层原理,redis为什么快,为什么是单线程,redis的io模型mq:了解和使用过哪些mq为什么学习这个mq(主波回答的kafka,理由是了解到各个互联网企业基本都是基于kafka的架构构建mq能力),在你们组中mq的消息有序,消息幂等,消息可靠性怎么保证的,kafka的io模型怎么实现的,mq消息积压怎么处理二面主要拷打实习经历以及场景题目,穿插一些八股,无手撕,应该是+1面开始面试官介绍了下部门主要业务然后开始提问自我介绍一下分享一下实习经历中做的比较有意思的需求然后就是各种拷打再分享一个实习经历中做的比较有意思的需求接着又是各种拷打再再分享一个实习经历中做的比较有意思的需求,拷打ing(三个需求说完已经40多分钟了)来一个场景题,c端需求,积分和红包可以相互兑换,怎么保证积分和红包数据一致还是这个场景,怎么保证积分和💰金额的一致性结束!三面压力小了很多,主要是实习经历和主观感受,应该是+2面先问了一二面是否介绍了部门然后自我介绍分享两个在实习中比较有意思的事,顺便拷打一下在实习经历中的两个企业的感受有什么不同,如果给你发offer更倾向哪一个你觉的两个企业在技术方面有什么不同秋招意向城市有哪些在实习中遇到印象最深的事自己的优缺点,举例子说一下经过两段实习你觉得研发工作中哪方面自己成长的比较快,哪方面还欠缺对欠缺的方面自己有什么想法结束!hr面基本是聊天自我介绍询问本科专业,什么时候考虑转码的,为什么转保研还是考研,准备了多久实习经历中印象最深的事情实习所在组主要是做什么业务(清楚简洁的描述出组内业务非常重要!)
点赞 评论 收藏
分享
评论
42
197
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务