面试字节大模型(LLMs)RAG面被问麻了~

  1. LORA 原理:解释 LORA(Low-RankAdaptation)的核心思想,如何通过低秩矩阵实现参数高效微调?数学形式如何表达?
  2. Self-Attention机制:自注意力机制中 O/K/ 矩阵的作用是什么?如何通过缩放点积计算注意力权重?公式推导并解释Softmax 的意义。
  3. 位置编码:Transformer为何需要位置编码?主流 LLM(如 LLaMA、GPT)使用哪种位置编码(如 ROPE)?相比绝对/相对位置编码有何优势?
  4. Seq2Seg 模型:Seq2Seq模型的核心组件是什么?Encoder-Decoder结构如何解决长程依赖问题?
  5. RAG技术:RAG(检索增强生成)的完整链路包含哪些步骤?为什么它能提升生成质量?
  6. 大模型幻觉:大模型产生幻觉的根本原因是什么?
  7. 显存计算:7B 模型在训练和推理时的显存占用如何估算?显存与参数量、批次大小、序列长度的关系是什么?
  8. 实习与论文:详细说明实习中解决的一个技术难点,涉及哪些模型或算法?如何评估效果?
  9. 链表操作:删除链表倒数第 N 个节点的算法思路?如何用双指针法实现?边界条件(如头节点删除)如何处理?

#大模型面试##大模型##AI##面试##RAG#
全部评论
面试题当然可以开源给大家 后台T一下
1 回复 分享
发布于 06-04 16:39 湖南
牛uT一份
点赞 回复 分享
发布于 06-08 19:39 浙江

相关推荐

05-25 16:38
已编辑
大连理工大学 C++
牛客270884252号:我们可能是把花的富有程度想象的过于不乐观了
投递拼多多集团-PDD等公司10个岗位
点赞 评论 收藏
分享
06-03 16:18
门头沟学院 Java
一上来直接项目拷打:☐ 缓存击大概描述一下,怎么解决☐ 什么是逻辑过期怎么实现,不是真正意义的过期怎么理解☐ 除了逻辑过期还有什么方案,怎么做(大脑宕机没想好)☐ 逻辑过期整个流程是怎么样的描述一下☐ Redission用来解决什么问题☐ 一人一单是什么意思☐ 你的Redission锁住的是什么☐ 一人两单你的方案还可以吗☐ 一个用户多端登录同时下单,一人两单你怎么解决(场景题)☐ 两个请求同时进来,同时去读库存,是不是都可以下单?你的方案能不能解这种场景(瞎说)☐ 乐观锁能不能解决上面的问题(一个用户多端登录同时下单,一人两单你怎么解决)☐ RabbitMQ为什么要用,主要解决什么问题☐ 你取消订单为什么用到死信队列,是怎么操作的☐ 怎么关闭订单,整个触发流程是怎么样的☐ 如果有很多用户都进来恶意下单,并没有支付,一瞬间就把库存消耗完了,这种情况你怎么解决(瞎说)☐ 超卖问题怎么解决线程部分☐ 缓存雪崩是什么,怎么解决,还有其他办法吗☐ 线程池有什么参数,解释一下☐ 为什么要设置前两个参数,主要解决什么问题☐ 为什么要用多线程,简单聊一下☐ 多线程效率比单线程效率高对不对,为什么☐ 什么情况用单线程什么情况用多线程☐ 你为啥用lua脚本然后就开始扯别的了没了大家觉得强度怎么样
点赞 评论 收藏
分享
评论
5
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务