百度后端开发实习一面凉经

1. 实习项目难点与解决
问题背景+解决思路+最终效果
2. Redis高并发优化
项目中如何使用Redis的?现在如果并发很大,Redis扛不住的话可以怎么优化?
3. 多层缓存一致性
多层缓存的数据一致性怎么解决?还有其他方案吗?
4. MySQL索引原理
讲讲MySQL的索引的原理,其他引擎或者是其他数据库的索引有没有了解?
5. MySQL主从延迟处理
MySql主从同步有延迟应该怎么处理?
6. MySQL查询压力优化
如果MySQL查询压力大怎么做?
7. 慢SQL排查与优化
慢sql是怎么排查和优化的?
8. 高效索引创建
如何创建正确高效的索引?
9. 大索引数据量问题
索引数据量庞大会造成什么问题?从数据插入和更新的角度来说一下?
10. RabbitMQ vs Kafka
RabbitMQ跟Kafka的区别是什么?
11.  Kafka延迟消息实现
Kafka能实现延迟消息吗?怎么实现?
12. MQ消息消费保证
MQ怎么保证消息消费的?
13. MQ宕机处理
MQ宕机了怎么办?
14. MQ队列满处理
MQ队列满了怎么办?
15. Golang内存泄漏排查
Golang内存泄漏的场景有哪些,怎么排查和优化?
16. 文档去重推荐
场景题:我们现在给用户推荐文档,如何保证用户所被推荐的文档不是重复推荐?
17. 二叉树右视图
全部评论
没有手撕嘛
点赞 回复 分享
发布于 2025-12-04 17:01 上海
请问什么bg呀 我投了都没消息 心碎了
点赞 回复 分享
发布于 2025-12-04 17:00 广东
文档去重这个场景题,还挺考验实际思路的
点赞 回复 分享
发布于 2025-12-04 15:09 福建
百度后端一面这题量也太顶了,覆盖得巨全
点赞 回复 分享
发布于 2025-12-04 15:09 黑龙江
想问一下,这个是哪个组的呀
点赞 回复 分享
发布于 2025-12-03 18:18 黑龙江

相关推荐

04-09 17:45
门头沟学院 Java
一、自我介绍与项目深挖做一下自我介绍。简单讲一个你最有代表性的项目,你在其中解决的最关键问题是什么?结合实习或项目,做细节追问(工作流、职责、决策、挑战等)。二、Agent 与提示工程相关提示词模板是怎么设计与迭代的?你如何判断一个模板真的变好了?你们的 Agent 是单 Agent 还是多 Agent?为什么这么设计?有没有考虑过替代方案?Agent 的任务是怎么拆分的?拆分粒度是怎么决定的?上下文是如何构建的?你们怎么避免上下文过长或信息污染?如果上下文窗口不够,你会优先保留哪些信息?为什么?三、代码理解与单测生成(工程场景)做代码理解时,AST、调用关系这些信息是怎么用起来的?单测生成里,哪些代码不适合生成单测?你们是如何识别并过滤的?覆盖率高但测试质量很差,你见过吗?你们是如何解决的?mock 在单测里什么时候是必须的?什么时候反而会带来问题?如果一个函数同时依赖数据库和 RPC,你怎么让模型生成的单测稳定运行?你们如何评估生成单测的质量? 除了覆盖率,还有哪些指标有效?四、LLM 基础与 Transformer 细节LLM 的输入到底是什么?模型真正看到的内容包含哪些?self-attention 的核心作用是什么?为什么要拆成 Q、K、V?为什么 attention 能建模长距离关系?为什么需要 multi-head?attention 为什么可以看成动态加权?同一个 token 的 Q、K、V 为什么不相同?attention 复杂度很高,当上下文特别长时,你会怎么优化?模型产生幻觉的常见原因是什么?工程上有哪些方法可以降低幻觉?五、后端与系统基础Python 有多线程吗?GIL 是干嘛的?什么时候多线程才是有用的?讲一下 C++ 从源码到可执行文件的完整编译流程。六、算法题(手撕)给定一个数组 nums,计算所有子数组的中位数之和。定义:如果子数组长度为奇数:中位数 = 排序后中间的数。如果为偶数:中位数 = 排序后靠左的那个数。要求:计算所有子数组的中位数之和。
查看24道真题和解析
点赞 评论 收藏
分享
04-24 17:20
门头沟学院 Java
发一下问题给大家参考,攒攒人品!1.实习拷打2.拷打第一个项目:如果长表格被切分到了两个不同的Chunk,如何保证大模型在回答时不丢失表头信息?为什么不直接把图片转成描述再做文本检索,而是做视觉Embedding?有什么好处?3.拷打第二个项目:你是如何设定记忆总结的触发条件的?是根据对话轮数总结,还是根据Token消耗量来总结?如果测评量表返回的数据量非常大,超过了模型窗口,在不丢失核心指标的前提下,如何对工具结果进行预压缩?4.为什么在做RAG时,切片不能切得太长,也不能切得太短?5.什么是混合检索?为什么一些场景下,只用向量检索效果不好?6.如何在Prompt中设计拒答逻辑,让模型在知识库没有相关内容时,不强行生成答案?7.什么是CoT?它在提升Agent逻辑推理能力方面的原理是什么?8.在Function Call的过程中,大模型返回给后端的是真实运行的结果,还是调用的意图?9.拷打Transformer10.了解MySQL吗?在MySQL中,如果要存储用户的对话记录,你会选择哪种字段类型?为什么?11.Redis有哪些常见的数据结构?12.为什么在大模型应用中,会把一些重复的问题和答案存入Redis缓存?13.介绍一下如何利用Redis存储大模型的响应结果?14.如果两个用户的提问意思一样但表达不同,如何判断该不该命中Redis里的缓存?15.在分布式Agent环境下,用户的Session应该存放在哪里?16.手撕:无重复字符最长子串
查看16道真题和解析
点赞 评论 收藏
分享
评论
4
13
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务