正实现的小目标

03-26 00:15 上海交通大学算法工程师

关注

OPPO大模型应用开发一面攒人品

继续来分享下之前的面经~欢迎友好讨论，信息共享
1. 项目拷打
2.实习拷打
3. 数据收集和处理，使用Grpah-Rag的优势，本项目中Grpah的作用。
4. 训练数据的构建细节
5. 遇到数据内容冲突时应该如何处理？
6. Rec、MRR、Acc等常见检索指标。
7. 除了LLM as a Judge，还有什么方法评测回答的效果？
8. 当不同的专家对同一回答评分方差很大时应该怎么解决？
9. 在校内的科研/实践经历。
10. 常见的Agent和Memory管理的范式。
11. 遇到的印象最深/工作量最多的实际工程编码问题。

全部评论

推荐最新楼层

上海交通大学算法工程师

强烈推荐！这个笔记写得很清晰 http://github.com/AccumulateMore/CV

1 回复分享

发布于 03-26 16:12 广东

哈哈哈，你是老六

门头沟学院大数据开发工程师

最后通过了吗

点赞回复分享

发布于 03-29 23:53 北京

哈哈哈，你是老六

门头沟学院大数据开发工程师

感觉问的还行啊

点赞回复分享

发布于 03-27 23:04 北京

门头沟学院算法工程师

刚开始准备找实习，请问大佬这些东西都是在哪学啊😭大学摆烂了四年

点赞回复分享

发布于 03-27 10:18 黑龙江

拼多多校园招聘2027

拼多多_基础电商_资深算法工程师

考虑我司不欢迎联系

点赞回复分享

发布于 03-27 00:09 上海

03-31 22:05

广西大学算法工程师

吉利科技大模型应用开发二面

感觉面试官自己也不是很熟 没怎么招过1. 你挑一个最熟悉的项目详细讲一下，重点说业务背景、数据形态和你负责的部分2. 如果大模型输出格式和你预期不一致，你一般怎么处理这个问题如果只回答“加强 prompt 约束”会显得太浅。真实场景里，输出格式不一致通常有三层原因：第一层是模型没理解任务边界，第二层是格式本身太脆弱，第三层是生成阶段没有约束。我的做法一般是先把格式要求拆成字段级约束，尽量避免开放式自然语言和结构化字段混在一起；然后再根据场景决定是用 schema 校验、函数调用、受限解码，还是生成后重排修复。如果业务要求严格，比如必须产出合法 JSON，我不会只依赖 prompt。我会让模型先...

AI-Agent面试实战...

点赞评论收藏

分享

03-14 02:15

门头沟学院机器学习

京东大模型应用开发实习面经

横向挂了，希望发出来对大家有帮助！1、实习拷打2、顺着RAG和Multi Agent方向，说说你对它们认知和迭代是怎样的？3、深挖项目4、ES、向量数据库具体怎么使用？5、如何处理问题输入不标准的情况？混合检索的权重怎么配置？6、向量检索的准召率如何保障？你使用的向量数据库之间的差异是什么？7、IVF和HNSW的差异？8、如何评测RAG系统的准确率？9、你对Transformer架构的优劣势及哲学理解是什么？关注过其他架构吗？

查看7道真题和解析

点赞评论收藏

分享

03-28 14:03

广西大学算法工程师

腾讯大模型应用开发二面

1. 如果让你设计一个 Agent 的规划器，怎么避免它每一步都重新规划，导致路径震荡？规划器不能每拿到一个 observation 就整体重算，不然很容易出现前一步刚决定检索，后一步又改成总结，再下一步又回去检索，整个执行路径会来回抖动。更稳的做法是把规划分成“全局计划”和“局部调整”两层。全局计划只定义阶段目标，比如信息收集、证据校验、结果生成；局部调整只允许在当前阶段内微调具体动作。另外要给 planner 一个明确的状态表示，比如当前子目标、已完成步骤、失败原因、剩余预算。如果没有状态约束，模型会把每次新 observation 当成全新任务来理解。线上一般还会加“重规划阈值”，只有在...

腾讯二面1098人在聊

点赞评论收藏

分享

03-21 04:30

门头沟学院 Java

字节大模型应用开发二面日常实习

发点面经攒攒人品～1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？6.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？8.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？9.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？10.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？11.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？15.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？16.针对大规模PDF解析这种任务，你选择多线程还是多进程？17.如何确保Agent返回的结果是标准的JSON格式？如果模型输出中有多余的说明文字，你在后端如何提取？18.场景题：对于RAG，如果检索到了针对同一故障的两份手册，内容相互冲突，请你设计一套逻辑，让模型能够识别冲突并优先选择时效性更高的信息？19.手撕：第k大元素

查看19道真题和解析

点赞评论收藏

分享

03-18 00:44

广西大学算法工程师

快手大模型开发一面

1、自我介绍2、说一下你日常中和实习中对于大模型的一些应用3、大模型应用到审核体系里面去的话，你有什么比较好的想法吗如果把大模型用到审核体系里，我会更倾向于把它设计成一个审核增强模块，而不是直接完全替代原有流程。因为审核场景最重要的是稳定性、准确率和可控性，如果一开始就把所有判断都交给大模型，风险会比较高。比较合理的方式是把审核拆成几层。先用规则和轻量模型做高确定性的初筛，把明显违规和明显正常的内容先分出去；对于边界模糊、语义复杂、上下文依赖强的内容，再交给大模型做进一步判断。大模型在这里可以承担语义理解、风险解释、相似案例归纳、标签推荐和辅助判定这些工作。这样既能利用它的泛化能力，又不会把整...

查看11道真题和解析

点赞评论收藏

分享

评论

2

10

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 面试体验最好和最差的公司 #

2432次浏览 18人参与

# 如何提高实习转正率？ #

98649次浏览 559人参与

# 厦门银行科技岗值不值得投 #

16975次浏览 408人参与

# 烂工作和没工作哪个更痛苦？ #

5843次浏览 100人参与

# 重来一次，我还会选择这个专业吗 #

443848次浏览 3942人参与

# 给工作过的公司写一条大众点评，你会怎么写？ #

2522次浏览 40人参与

# 银行笔面经互助 #

189842次浏览 1312人参与

# AI替代不了什么？ #

5190次浏览 77人参与

# 春招至今，你收到几个面试了？ #

10146次浏览 163人参与

# 现在入门AI首先要做什么？ #

1184次浏览 36人参与

# 选完offer后，你后悔学本专业吗 #

67892次浏览 267人参与

# 学历VS实习，哪个更重要？ #

16787次浏览 229人参与

# Agent面试会问什么？ #

3986次浏览 103人参与

# 一人分享一个skill #

883次浏览 27人参与

# 职场吐槽大会 #

344777次浏览 2275人参与

# 总结:offer选择，我是怎么选的 #

280204次浏览 1547人参与

# 机械人，你的秋招第一份简历被谁挂了 #

260902次浏览 2435人参与

# 2023届毁约公司名单 #

253218次浏览 1072人参与

# 月薪多少能在一线城市生存 #

148969次浏览 908人参与

# 一人分享一道面试手撕题 #

116383次浏览 2980人参与

# 你做过哪些dirty work #

32159次浏览 162人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务