问的贼细:京东大模型算法面试
✅一面
1.直接开始八股
2.Transformer 中为什么用LN不用BN
3.图像中 BN 是怎么用的
4.在 NLP 中如果句子长度不一致,用 BN 会有什么后果
5.给定三维矩阵bsz * seq_len * dim,BN和LN分别作用在哪个维度
6.已知bsz seq_len dim head,参数量是多少,和哪几个参数有关
7.带有多个注意力头的注意力机制计算过程
8.说出pytorch中维度变换的函数
9.显存OOM,参数,ZERO,vllm,梯度累积,优化器,混合精度
10.讲一下实习经历
11.长度外推技术
12.觉得自己做得最好的点是什么
13.使用华为的框架和显卡进行SFT有没有遇到什么问题
14.LongLoRA和LoRA的区别
15.算法题:返回第K大的数,要求比快排更快
✅二面
1.自我介绍
2.询问实习时间
3.快手推荐实习主要做的什么
4.实习期间做了哪些优化
5.LLM 的长度扩展策略有哪些
6.介绍 YaRN
7.用户是怎么用你们的工具的
8.幻觉怎么判断出来,如何解决
9.是否有调用外部搜索引擎
10.有没有用到Agent和RAG
11.910B适配过程中遇到的问题
12.深挖NIPS论文
13.下游任务介绍,效果为什么会有提升
14.给了一个现实生活中的例子,你的这篇论文怎么套上去
15.实习期间最大的挑战
16.技术上最有难度的事情是什么
17.转正和目前的offer情况
✅三面
1.自我介绍
2.对京东的感受
3.有没有觉得不好的地方
4.HR 介绍了京东的价值观
5.科研或者实习过程中有没有做过很创新的东西
6.这个过程中有没有遇到什么很困难的事情
7.交流技术的渠道一般都有哪些
8.觉得之前实习工作强度如何
9.目前的 offer 情况
✴️算法求职辅导,欢迎后台联系
1.直接开始八股
2.Transformer 中为什么用LN不用BN
3.图像中 BN 是怎么用的
4.在 NLP 中如果句子长度不一致,用 BN 会有什么后果
5.给定三维矩阵bsz * seq_len * dim,BN和LN分别作用在哪个维度
6.已知bsz seq_len dim head,参数量是多少,和哪几个参数有关
7.带有多个注意力头的注意力机制计算过程
8.说出pytorch中维度变换的函数
9.显存OOM,参数,ZERO,vllm,梯度累积,优化器,混合精度
10.讲一下实习经历
11.长度外推技术
12.觉得自己做得最好的点是什么
13.使用华为的框架和显卡进行SFT有没有遇到什么问题
14.LongLoRA和LoRA的区别
15.算法题:返回第K大的数,要求比快排更快
✅二面
1.自我介绍
2.询问实习时间
3.快手推荐实习主要做的什么
4.实习期间做了哪些优化
5.LLM 的长度扩展策略有哪些
6.介绍 YaRN
7.用户是怎么用你们的工具的
8.幻觉怎么判断出来,如何解决
9.是否有调用外部搜索引擎
10.有没有用到Agent和RAG
11.910B适配过程中遇到的问题
12.深挖NIPS论文
13.下游任务介绍,效果为什么会有提升
14.给了一个现实生活中的例子,你的这篇论文怎么套上去
15.实习期间最大的挑战
16.技术上最有难度的事情是什么
17.转正和目前的offer情况
✅三面
1.自我介绍
2.对京东的感受
3.有没有觉得不好的地方
4.HR 介绍了京东的价值观
5.科研或者实习过程中有没有做过很创新的东西
6.这个过程中有没有遇到什么很困难的事情
7.交流技术的渠道一般都有哪些
8.觉得之前实习工作强度如何
9.目前的 offer 情况
✴️算法求职辅导,欢迎后台联系
全部评论
相关推荐
点赞 评论 收藏
分享
点赞 评论 收藏
分享
点赞 评论 收藏
分享