百度实习 AIGC算法面经分享

攒攒人品!有面试过同岗的朋友欢迎评论区交流
1.对于社区讨论类、用户生成内容较多的数据源,会做哪些额外的数据清洗或质量控制?
2.如何对metadata做数据处理?
3.检索系统中,数据预处理、metadata 设计和索引构建是如何考虑的?
4.检索阶段是如何做召回和精排的?为什么要结合关键词检索、语义检索和 rerank?
5.检索结果注入生成模型后,这个模型是用于实验验证,还是面向真实部署场景?
6.如果后续要正式落地,你会从哪些维度重新评估模型选型?
7.你如何理解 RAG?它的核心目标是什么?
8.RAG 的典型流程包括哪些阶段?每个阶段的关键点分别是什么?
9.在实际应用中,RAG 的效果上限主要受哪些因素影响?
10.在什么场景下更适合使用 RAG,而不是把规则或知识直接固化到系统逻辑里?
11.在 Agent 或助手系统里,tool calling 一般适合解决什么问题?
12.MCP 或类似协议在工具调用体系里主要起什么作用?
13.Skills 和 tool calling 的区别是什么?
14.如果要用 skills 重构一个现有助手系统,哪些模块最适合优先抽象成 skills?
15.在多模态系统中,引入 Adapter 的主要作用是什么?
16.Adapter 在模态对齐、参数高效训练、信息筛选和可迁移性上分别有什么价值?
17.用模型对长文本做预提取、重写或摘要,与直接截断相比,有什么本质区别?
18.滑动窗口、摘要压缩、关键词提取、长期 memory 存储,这几类方案分别适合什么场景?
19.DPO 和 GRPO 的核心区别是什么?
全部评论
这问的真的多啊
点赞 回复 分享
发布于 03-22 22:27 北京

相关推荐

全是八股轻松拿下,面完隔一天就说 oc 了(接了之后突然和我说加面,后面过了但是说 hc 无了)1. Go 语言有哪些特点2. 值类型和引用类型有哪些3. slice 和 array 的区别4. map 是否并发安全 / 为什么并发写不安全5. goroutine 和线程的区别6. 栈内存和堆内存的使用场景7. Go 的 GC 机制8. 逃逸分析 (escape analysis)9. context 的作用10. MySQL 常用引擎及区别 / 适用场景11. MySQL 索引类型12. 事务四大特性 ACID13. 事务隔离级别及可能造成的问题14. MySQL 底层日志 binlog / redolog / undolog15. MySQL 主从复制原理16. Redis 常用数据类型及适用场景17. Redis 为什么快18. Redis 数据量过大时为什么会变慢19. Redis 持久化机制20. Redis 分布式锁21. 为什么 Go 推荐 goroutine + channel 但还需要 Redis 分布式锁22. 消息队列中间件使用经验23. IO 多路复用原理24. HTTP 有什么特点25. 多模态内容(用户/商品)的点赞/评论/关注聚合展示 - 表结构设计26. 异步写入的缺点 / 一致性问题27. 职业规划28. 自我评价29. 工作中遇到问题如何解决
查看29道真题和解析
点赞 评论 收藏
分享
04-08 06:25
门头沟学院 Java
发一下问题给大家参考,攒攒人品!1. 如何实现多 Agent 协作系统?2. 什么是 RAG(Retrieval Augmented Generation)?3. Java 如何实现 streaming response?4. 什么是 hallucination(幻觉)?为什么会发生?5. LangChain4j 如何返回结构化 JSON?6. 如何实现 SSE 推送?7. 如何评估 Agent 的执行效果?8. LLM 服务如何做缓存?9. LangChain4j 如何实现 Tool 调用?10. 什么是 AI Agent?11. 什么是 Prompt Engineering?12. Agent 和普通 ChatBot 有什么区别?13. RAG latency 怎么优化?14. Java 调用 OpenAI API 如何设计 SDK?15. RAG pipeline 的完整流程是什么?16. RAG 系统主要组件有哪些?17. 如何设计一个 AI 问答系统架构?18. RAG 如何做 rerank?19. AI系统如何做监控?20. embedding 和向量相似度搜索是什么?21. 什么是 ChatMemory?22. Java LLM 服务如何做连接池管理?23. 如何评估 RAG 系统效果?24. Agent memory 有哪些类型?25. 如何实现对话历史 memory?26. Transformer 架构核心原理是什么?27. 如何减少大模型 hallucination?28. LLM API 如何设计接口?29. chunk size 为什么很重要?如何选择?30. 如何实现 hybrid search(向量 + keyword)?31. 什么是 ReAct Agent?32. Spring AI 和 LangChain4j 有什么区别?33. 什么是 Tool Calling?34. embedding 模型如何选择?35. AI Chat 系统的整体架构是什么?36. 文档切分有哪些策略?37. LLM 服务如何做限流?38. LangChain4j 如何实现 prompt template?39. ChatGPT 的 system / user / assistant role 有什么作用?40. LLM 为什么推理成本高?41. AI系统如何记录 Prompt 和 Response?42. Agent 如何做任务规划(planning)?43. LLM latency 如何优化?44. 如何设计 Prompt 管理系统?45. streaming response 如何实现?46. MCP(Model Context Protocol)是什么?47. Agent workflow 和普通 workflow 有什么区别?48. 大模型上下文窗口是什么?如何突破长度限制?
点赞 评论 收藏
分享
评论
2
6
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务