百度

收藏
企业服务
10000人以上
上市
北京
学历友好榜高校必争榜offer比较常胜榜校招高薪榜牛客指数榜
查看官网
上传简历
职位类型
全部
后端开发
前端开发
客户端开发
测试
数据
更多
最新
热门
昨天 17:20
门头沟学院 Java
发一下问题给大家参考,攒攒人品!1.实习拷打2.拷打第一个项目:如果长表格被切分到了两个不同的Chunk,如何保证大模型在回答时不丢失表头信息?为什么不直接把图片转成描述再做文本检索,而是做视觉Embedding?有什么好处?3.拷打第二个项目:你是如何设定记忆总结的触发条件的?是根据对话轮数总结,还是根据Token消耗量来总结?如果测评量表返回的数据量非常大,超过了模型窗口,在不丢失核心指标的前提下,如何对工具结果进行预压缩?4.为什么在做RAG时,切片不能切得太长,也不能切得太短?5.什么是混合检索?为什么一些场景下,只用向量检索效果不好?6.如何在Prompt中设计拒答逻辑,让模型在知识库没有相关内容时,不强行生成答案?7.什么是CoT?它在提升Agent逻辑推理能力方面的原理是什么?8.在Function Call的过程中,大模型返回给后端的是真实运行的结果,还是调用的意图?9.拷打Transformer10.了解MySQL吗?在MySQL中,如果要存储用户的对话记录,你会选择哪种字段类型?为什么?11.Redis有哪些常见的数据结构?12.为什么在大模型应用中,会把一些重复的问题和答案存入Redis缓存?13.介绍一下如何利用Redis存储大模型的响应结果?14.如果两个用户的提问意思一样但表达不同,如何判断该不该命中Redis里的缓存?15.在分布式Agent环境下,用户的Session应该存放在哪里?16.手撕:无重复字符最长子串
查看16道真题和解析
点赞 评论 收藏
分享
给我面没招了,发点面经攒攒人品~1. 实习拷打2. 选了一个大模型项目进行深挖3. 这个项目里你真正主导的部分是什么?4. 你这个项目到底解决了什么业务问题?原来人工是怎么做的,痛点在哪?5. 你这个 Agent 是问答型、决策型,还是执行型?边界是什么?6. 从用户输入到最终输出,你这套系统的真实链路是什么?7. 哪些环节必须用大模型,哪些环节不用大模型也能做?8. 如果不用 Agent,只用规则、检索、模板 SQL,能做到几成效果?为什么还要上 Agent?9. 你的知识源具体是什么?API 文档、日志、DDL、Wiki 这几类数据里,最难处理的是哪类?10. 你们知识入库前做了哪些预处理?这些步骤分别在解决什么问题?11. 你为什么把 chunk 设成 512?和 128、1024 相比,各自的 trade-off 是什么?12. 你怎么区分“模型上下文长度”和“知识切片长度”这两个概念?13. 如果 top-k 已经召回了正确证据,但模型还是答错了,你怎么判断问题是在检索、排序,还是生成?14. 如果检索结果本身互相冲突,或者证据不充分,你怎么约束模型?15. 你为什么选 QLoRA,而不是全量微调?16. 你这里的 SFT,本质上是在教模型什么?是教知识、风格,还是行为边界?17. 你做 DPO 的时候,chosen 和 rejected 是怎么定义的?18. 如果 chosen 和 rejected 差异太小,会发生什么?19. 你怎么证明 rejected 真的是有效负样本,而不是误杀?20. 你这个 LLM-as-a-Judge 是怎么设计的?rubric 里哪些维度是硬门槛,哪些只是加分项?21. 为什么要做一致性检测 / swap consistency?它防的是哪类偏差?22. 你怎么做 ablation,证明提升真的是 RAG、SFT、DPO 或 Judge 带来的,而不是别的变量?23. 手撕代码  动态规划24.开放题把DPO 跟Judge 思路迁移到一个视频二创场景:如果目标是让模型扮演某个角色,比如孙悟空,你怎么构造 chosen 和 rejected?视频质量和音频质量如果也跟进的话优先级怎么定?
查看22道真题和解析
点赞 评论 收藏
分享
分享我的面试经验
模拟面试
真实面试体验,快速补齐短板
应聘感受
暂无应聘感受
牛客网
牛客网在线编程
牛客网题解
牛客企业服务