淘天ai应用研发实习面经分享

发一下问题给大家参考,攒攒人品!
1.展开介绍项目
2.LRU缓存的数据结构
3.异步处理时的生产者、消费者模型/缓冲区设计方案/缓冲区的底层数据结构
4.读远远大于写的多线程场景下,如何保证安全
5.讲述整个过程:浏览器输入网址 -> 怎么找到服务器- > 服务器如何找到正在的业务服务
6.RAG知识库在问答场景下的质量评估
7.Transformer思想
8.多头注意力的好处
9.为什么说Transformer适配并行计算
10.提示词工程:为什么给具体案例Few-Shot,比单纯文字指令,大模型听话的多、人设更稳、风格更统一?
11.大模型【思考/推理/自省】三大范式——CoT/思维链 Prompt、12.Plan&Execute先规划再执行、RAG边检索边思考、原生Thinking底座模型的使用场景的差别?
13.向量检索已经打过分数了,为什么还要做精排?
14.LoRA微调与传统全量SFT
15.有了SFT监督微调,为什么还要强化学习RLHF/RL
16.讲讲论文成果
17.AI编程-基于Qwen3.5模型编程
全部评论

相关推荐

一、自我介绍二、实习相关八股1. 实习业务场景负责大模型对话对齐、指令微调、强化学习优化,提升模型生成准确性、合规性与指令遵循度,落地垂类对话/问答业务。2. SFT数据筛选、采样及处理3. 选择GRPO的原因、优化目标及数学原理- 选型原因:相比PPO显存占用低、无需价值网络、训练更稳定,对齐效率高- 优化目标:最大化模型生成优势,约束KL散度防止策略突变- 原理:分组优势归一化、截断策略比率、近端约束,降低训练方差4. 奖励函数设计(重点)围绕有用性、准确性、合规性、流畅性设计,分维度打分;加入KL惩罚,避免单一奖励过拟合,区分正负奖励权重。5. 判断RL训练质量达标方法- 奖励值收敛、KL散度稳定;- 离线评测:指令遵循率、幻觉率达标;- 人工抽检生成内容,无退化、无套路化输出6. 是否遇到Reward Hacking遇到过,模型生成空洞话术、固定模板刻意刷高奖励值。7. 其他奖励作弊类型刻意迎合奖励规则、答非所问、重复安全话术、回避核心问题、策略坍缩同质化输出。8. PPO和DPO了解- PPO:在线强化学习,近端策略优化,带价值网络,训练复杂度高- DPO:离线偏好优化,基于成对偏好数据,无需交互采样,训练简单稳定三、基础八股1. Attention计算时间复杂度标准自注意力:O(n²d)(n为序列长度,d为特征维度)2. KV Cache原理推理时缓存历史token的KV矩阵,避免重复计算,降低算力开销,提升推理速度。3. GQA、MLA原理- GQA:分组查询注意力,Q分组共享KV,平衡推理速度与效果- MLA:融合局部+全局注意力,适配长上下文,降低显存占用4. vLLM原理基于PagedAttention分页管理KV Cache,提升显存利用率,支持高并发推理。5. Flash Attention原理分块计算注意力,优化显存IO,减少HBM访问,提速同时降低显存开销。6. 稀疏注意力原理仅计算局部/关联token注意力,舍弃全局无关token,将复杂度降至O(n),适配长文本。7. 模型推理慢排查思路检查序列长度、batch大小;确认KV Cache、量化、FlashAttention开启;排查GPU显存、算子优化问题。四、编程题1. rand7()实现rand10()拒绝采样:rand7()*rand7()生成1-49数,保留1-40,映射为1-10,超出则重新生成。2. 浮点数组取整最小变化和贪心思路:每个数选上/下取整中差值更小的,累加最小总误差。3. 最长无重复子串
查看19道真题和解析
点赞 评论 收藏
分享
05-02 22:50
门头沟学院 Java
继续来分享下最近的面经~欢迎友好讨论,信息共享1.实习拷打2.你刚刚说用AI写的那套东西,能介绍一下你具体做了什么?从AI写代码到交付,整个流程是怎么弄的?3.你的项目有前后端吗?大概结构是怎样的?怎么让AI帮你搞出一套能线上正式运行交付的东西?4.你实现这个项目涉及到哪些应用、中间件组件?我需要你说明系统设计的技术选型、底层逻辑,比如爬取后做什么,完整的业务流程讲清楚。5.如果是公司里的实际场景,比如有几十个应用,涉及前端、后端系统,要改一个需求可能需要改多个系统,你让AI怎么处理?6.你用的是什么模型?7.做这个项目消耗了多少token?8.开发中token很昂贵,节省token有哪些方式?9.SDD/TDD这块了解吗?10.那你知道创建一个skill有哪些方式吗?除了自然语言描述,还有什么方式?11.说一说你对function calling的理解。12.function calling和MCP相比,是不是可以没有MCP?13.MCP和客户端通信有几种方式?你怎么配置MCP?14.function calling是通过什么告诉大模型有哪些工具可用?15.大模型使用MCP调用查询天气工具,整个交互流程大概是怎样的?不用太细。16.笔试的时候,你是怎么和系统交互的?没改代码吗?17.你怎么确保AI写的代码没问题?用的是单agent吗?18.单agent和多agent相比,多agent的优势在哪里?19.能用英文口语说1分钟左右吗?20.你平时用的数据库是MySQL吧?如果线上数据量特别大,分页查询变慢,拿到这个优化任务,你的操作步骤是怎样的?21.如果单纯是数据量大导致深度分页查询慢,优化思路是什么?22.MySQL的索引结构你了解吗?为什么是B+树,而不是红黑树、平衡二叉树或者哈希结构?23.HashMap的1.8和1.7相比,做了哪些优化?24.除了结构和插入方式,还有其他优化吗?为什么插入方式会不一样?25.线程池用过吧?它的核心参数有哪些?原理是怎样的?26.Redis你使用了哪些场景?怎么实现的?27.Redis实现分布式锁的原理是什么?28.如果锁的过期时间是1分钟,任务还没执行完,其他人会不会抢锁?29.(看门狗机制下)如果任务一直卡住,其他人是不是都拿不到锁?
查看28道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务