一下午面了三个大模型岗,全是一言难尽...

真服了,我不信有这个题,还不会 常见的业务题 ◆ 大模型(LLMs)基础面 • 目前主流的开源模型体系有哪些? • prefix Decoder 和 causal Decoder 和 Encoder-Decoder 区别是什么? • 大模型LLM的 训练目标 是什么? • 涌现能力是啥原因? • 为何现在的大模型大部分是Decoder only结构? • 简单 介绍一下 大模型【LLMs】? • 大模型【LLMs】后面跟的 175B、60B、540B等 指什么? • 大模型【LLMs】具有什么优点? • 大模型【LLMs】具有什么缺点? ◆ Layer normalization 篇 • Layer Norm 的计算公式写一下? • RMS Norm 的计算公式写一下? • RMS Norm 相比于 Layer Norm 有什么特点? • Deep Norm 思路? • 写一下 Deep Norm 代码实现? • Deep Norm 有什么优点? • LN 在 LLMs 中的不同位置 有什么区别么?如果有,能介绍一下区别么? • LLMs 各模型分别用了 哪种 Layer normalization? ◆ LLMs 激活函数篇 • 介绍一下 FFN 块 计算公式? • 介绍一下 GeLU 计算公式? • 介绍一下 Swish 计算公式? • 介绍一下 使用 GLU 线性门控单元的 FFN 块 计算公式? • 介绍一下 使用 GeLU 的 GLU 块 计算公式? • 介绍一下 使用 Swish 的 GLU 块 计算公式? ◆ Attention 升级面 • 传统 Attention 存在哪些问题? • Attention 优化方向 • Attention 变体有哪些? • Multi-head Attention 存在什么问题? • 介绍一下 Multi-Query Attention? • 对比一下 Multi-head Attention 和 Multi-Query Attention? ◆ transformers 操作篇 ◆ LLMs 损失函数篇 ◆ 相似度函数篇 ◆ 大模型(LLMs)进阶面 ◆ 大模型(LLMs)微调面 ◆ LLMs 训练经验帖 ◆ 大模型(LLMs)langchain 面 ◆ 多轮对话中让AI保持长期记忆的8种优化方式篇 ◆ 基于langchain RAG问答应用实战 ◆ 基于LLM+向量库的文档对话 经验面

没有绝对的天才,只有持续不断的付出。对于我们每一个平凡人来说,改变命运只能依靠努力+幸运,但如果你不够幸运,那就只能拉高努力的占比。

内容涉及到:面试题(含答案)+学习笔记+电子书籍+学习视频,已经打包在简介。 .......

#求职##研究生##大模型##大模型找工作#
全部评论
佬,求求
1 回复 分享
发布于 08-09 09:01 浙江
1 回复 分享
发布于 08-06 01:10 香港
1 回复 分享
发布于 07-20 20:27 北京
1 回复 分享
发布于 07-10 19:33 河南
1 回复 分享
发布于 07-08 16:46 重庆
1 回复 分享
发布于 06-13 09:42 山东
1 回复 分享
发布于 05-28 15:18 广东
1 回复 分享
发布于 05-18 21:11 北京
1 回复 分享
发布于 05-16 22:51 新加坡
面试题当然可以开源给大家 后台T一下
1 回复 分享
发布于 04-28 15:24 湖南
点赞 回复 分享
发布于 09-18 22:45 北京

相关推荐

10-03 18:26
门头沟学院 Java
一面 8.18面试官迟到15分钟1. 在高并发的情况下java线程池参数怎么设置2. JDK不同版本有什么区别3. 消息队列怎么保证可靠性(幂等,顺序,消费)4. 如果消息丢失了怎么办,在业务层有没有做什么处理(我说了分布式事务里面数据库持久化然后定时失败监听)5. AI项目细节,chunk怎么分,怎么保证查询的向量都是相关的,长记忆和短记忆的区别6. AOP+redis限流怎么实现的,为什么使用lua脚本7. 怎么实现分布式锁,redis持久化,redission和redis的关系,redission在jvm中的优化(这是什么?)8. 情感分析模块一般处理比较慢,如何解决阻塞问题(我这里是结合我自己做的项目,讲了k8s的缩扩容)然后问了点k8s基础。9. 怎么协调团队合作10. 开发中有什么好的习惯(我说了一个遵守阿里巴巴的Java开发手册,然后我有什么准则)无手撕(约了22号的二面,在二面的早上给我打电话说要补个手撕,于是约了个下午2.的面试,就写了个二叉树最大路径和)二面 8.221. 为什么没有去互联网实习2. 讲一个项目,项目的难点有哪些,问的很深入,每个步骤为什么要这么做都问了3. 问了AI的项目,展开了一些4. 做爬虫的时候可能每个网页的html结构都不一样,人工去解析很麻烦,有什么办法吗?(我说可以专门弄个agent模块来处理,面试官说有点意思让我具体讲讲,结果后面讲的不是很明白)5. 对ai的了解有哪些(照例报菜名)6. 怎么让长上下文的情况下记忆更准确7. rag能做哪些优化呢8. 现在生活中对ai的使用主要有哪些,怎么看待ai对未来工作的影响9. http1-3都有哪些优化10. http2有没有解决tcp头阻塞问题11. http3是怎么解决tcp头阻塞问题的12. quic是怎么保证可靠性的,保证了这些可靠性难道就不会阻塞吗(这个问题我不是很理解)13. tcp的阻塞控制四个阶段分别是怎么样的14. 什么时候毕业15. 现在有没有其他的offer16. 更期望的base地17. 本科学的gis,硕士却读软件工程,为什么?职业规划是怎么样的。18. 自己的优点和缺点,这里也有一些展开的追问19. 没在互联网实习过,你怎么看待互联网现在卷的氛围,你觉得你能适应吗hr面 9.24(等麻了)很阿里味的hr面,问了几个agent相关的技术问题意向 9.29
查看29道真题和解析
点赞 评论 收藏
分享
评论
4
16
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务