问的贼细:京东大模型算法面试

✅一面
1.直接开始八股
2.Transformer 中为什么用LN不用BN
3.图像中 BN 是怎么用的
4.在 NLP 中如果句子长度不一致,用 BN 会有什么后果
5.给定三维矩阵bsz * seq_len * dim,BN和LN分别作用在哪个维度
6.已知bsz seq_len dim head,参数量是多少,和哪几个参数有关
7.带有多个注意力头的注意力机制计算过程
8.说出pytorch中维度变换的函数
9.显存OOM,参数,ZERO,vllm,梯度累积,优化器,混合精度
10.讲一下实习经历
11.长度外推技术
12.觉得自己做得最好的点是什么
13.使用华为的框架和显卡进行SFT有没有遇到什么问题
14.LongLoRA和LoRA的区别
15.算法题:返回第K大的数,要求比快排更快
✅二面
1.自我介绍
2.询问实习时间
3.快手推荐实习主要做的什么
4.实习期间做了哪些优化
5.LLM 的长度扩展策略有哪些
6.介绍 YaRN
7.用户是怎么用你们的工具的
8.幻觉怎么判断出来,如何解决
9.是否有调用外部搜索引擎
10.有没有用到Agent和RAG
11.910B适配过程中遇到的问题
12.深挖NIPS论文
13.下游任务介绍,效果为什么会有提升
14.给了一个现实生活中的例子,你的这篇论文怎么套上去
15.实习期间最大的挑战
16.技术上最有难度的事情是什么
17.转正和目前的offer情况
✅三面
1.自我介绍
2.对京东的感受
3.有没有觉得不好的地方
4.HR 介绍了京东的价值观
5.科研或者实习过程中有没有做过很创新的东西
6.这个过程中有没有遇到什么很困难的事情
7.交流技术的渠道一般都有哪些
8.觉得之前实习工作强度如何
9.目前的 offer 情况
✴️算法求职辅导,欢迎后台联系
全部评论

相关推荐

05-28 22:52
已编辑
北京理工大学 C++
京东零售-产研timeline:0515 一面0521 约二面0526 二面0527 约三面0528 三面,下午oc##一面:50min1. 简单介绍一下项目2. zookeeper是做什么用的    a. 为什么用zookeeper,还了解哪些其他的3. 为什么用protobuf而不是其他协议    a. 跟其他协议比有什么优势    b. 为什么速度快体积小4. 怎么解决tcp粘包拆包问题的5. 遇到过什么困难,怎么解决的6. 硕士学过什么课程    a. 一般怎么自学的    b. 有没有关注什么技术网站’7. 网络是怎么通信的8. tcp建立连接过程    a. 为什么要三次不能两次9. 一个存了40亿个字的文件,在一个内存(2GB)很小的旧电脑里,怎么查找里面有没有没出现某个数?可以用什么数据结构?怎么设计算法?    a. 不知道,提示下说了与或,说了哈希set但很暴力,面后查了一下:用位图(BitSet),原理:用一个足够大的 bit 数组(每一位表示一个整数是否出现过)10. MySQL索引结构是什么11. 唯一索引和主键索引区别?12. 联合索引(a,b)能不能查b?13. 了解哪些设计模式?单例模式的使用场景?14. 本科学过什么为什么换专业15. 为什么想做后端16. 能不能转java17. C++是怎么学习的18. 还面了什么公司反问:1. 业务做什么的、技术栈2. 对实习生有什么要求?3. 怎么去提高那些方面?前情:前一天半夜刚做完测评,于当日下午突然接到电话,说下周一有没有时间聊一下,说了两个时间都刚好跟别的撞了,遂约在当晚八点半。太突然了鼠鼠突然迎来人生处女面,很多东西都没有准备好🥹不过面试官人真超好一直笑呵呵的很亲和,鼠鼠太菜了全程很多题没答上来但氛围都没有尴尬。##二面:30min1. 可以实习多久2. 为什么想做这个方向3. 专业问题,未来规划问题4. 举一个体现学习能力的例子5. 遇到了什么难点,怎么克服的6. 具体是怎么去学习的7. 手撕一个最长回文子串,共享屏幕,限时5min8. 写一个sql题:表示不会写9. 反问:实习生工作、对实习生的期待、流程要多久##三面:40min就是常规问题,能实习多久、毕业压力大不大、学校做的研究课题和创新点、遇到的困难怎么解决的、最有成就感的事情、讲一个学生工作经历、为什么转专业、未来规划之类的。反问:部门业务、实习生业务、实习生人数、转正率、是否要转java和会不会有要求、工作氛围和工作时长等。
点赞 评论 收藏
分享
评论
5
18
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务