科大讯飞 大模型算法实习 面经

发一下问题给大家参考,攒攒人品!
1.实习经历项目
2.Python列表与生成器区别
3.两个张量 一个为1*2*3,一个为3*2*1 二者能进行哪些操作
4.8B大模型用int8量化会占用多少硬盘内存
5.如何让大模型能够实现128K的上下文
6.后训练中强化学习方法介绍
全部评论
问的似乎不多呢
点赞 回复 分享
发布于 昨天 18:51 北京

相关推荐

头像
03-03 13:17
已编辑
苏州大学 Java
面试官真的很有耐心,人非常nice,但问得也是真的很细。面完半小后约HR面。有没有人说说HR面会问啥?【希望能过吧,以前真没想到面个试这么耗精力,这一周感觉都被掏空了】1.请做一下自我介绍。2.你掌握的数据结构有哪些?3.请讲一下一致性哈希的原理和解决的问题。4.请讲一下Ring buffer(环形缓冲区)的相关内容。5.请讲解一下HTTP状态码的相关分类和含义(如2xx、3xx、4xx、5xx)。6.请讲解一下四层网络负载均衡和七层网络负载均衡的区别,以及各自的应用场景。7.请讲一下反向代理的原理和常用工具,以及正向代理的相关内容。8.进程间通信的方式有哪些?哪种方式效率更高,为什么?9.请讲一下MySQL主从复制的实现原理(基于binlog、redolog相关)。10.多个从节点之间出现数据不一致的问题该如何解决?11.你了解的消息中间件有哪些?RabbitMQ、RocketMQ、Kafka这三种消息中间件的区别是什么?12.Redis中最常用的数据结构有哪些?13.请讲一下Redis中Zset(sorted set)的底层实现和优化策略。14.什么是小哈希和大哈希,二者在查找、插入性能上有什么区别?15.请讲一下TCC分布式事务算法的相关内容,以及它和2PC、3PC的区别。16.你在项目中使用的服务发现组件是什么,它的实现原理是什么?17.你在项目中使用的序列化协议是什么,为什么选择该协议?18.长连接的适用场景是什么?哪些场景不适合使用长连接,原因是什么?19.请设计一个评论系统(包括数据库表设计、数据结构、关联关系等)。20.【反问】想具体知道会做哪些模块的工作?有没有导师?
百特曼3:节子还是一如既往的八股大厂
查看78道真题和解析
点赞 评论 收藏
分享
一面: 1. 自我介绍,讲论文和实习。2. Transformer自注意力机制、位置编码、梯度消失/爆炸的解决方案。3. 微调方法对比(Full Fine-tuning vs. LoRA/Adapter/P-Tuning)。4. 推理加速技术(量化、动态批处理、FlashAttention)。5. 如何优化大模型在长文本生成中的显存占用?6. RLHF中奖励模型(RM)的训练数据如何构建?7. 为网易云音乐设计一个AI歌词生成系统,如何提升创意性和押韵效果?8. 模型剪枝/量化(GPTQ、AWQ)、服务化框架(FastAPI+vLLM)。9. 如何解决大模型API服务的响应延迟问题?一面八股挺多的,问的知识点也非常多,主要考察对大模型的理解,整体来说难度不算大,复习熟记八股应该都比较好答。二面:1. 自我介绍,讲论文和实习。2. LayerNorm和BatchNorm在大模型中的区别?为什么Transformer用LayerNorm?3. 解释大模型训练中的“灾难性遗忘”现象及解决方法。4. 如果微调后的模型过拟合,你会如何调整?5. 如何评估一个对话系统的生成质量?6. 如何用大模型提升网易新闻的推荐效率?7. 设计一个游戏内AI陪玩系统,需考虑哪些模块?8. 领域适配时,如何构建高质量的垂域训练集?9. 你在项目中如何解决数据稀缺问题?10. 模型上线后遇到了什么性能瓶颈?如何优化的?建议:精读《Attention Is All You Need》、HuggingFace文档。如果没有大模型项目,可用Kaggle/开源项目复现(如LangChain应用)。
查看18道真题和解析
点赞 评论 收藏
分享
评论
1
2
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务