飞猪大模型 一二面整理

已发意向
一面:
自我介绍
围绕实习问了增量预训练
SFT和强化学习的取舍
数据合成和筛选流程
无八股
手撕
两数之和

二面:
自我介绍
问了下对齐方面的问题,主要是GRPO PPO DPO区别和怎么应用
落地项目的一些难点,项目和飞猪当前方向相关,做智能客服
deepseek的八股 如MLA原理,GRPO的优势函数怎么计算
无手撕
30分钟左右,口头发了offer

HR面
问了下base意向,面完秒发意向
全部评论
请问二面后多久结果啊~
点赞 回复 分享
发布于 05-22 14:54 浙江
uu你好,飞猪base除了杭州还有哪里呀,以及hr有提实习待遇之类嘛
点赞 回复 分享
发布于 04-08 23:28 四川
这不是我猪背上的哥们嘛
点赞 回复 分享
发布于 04-08 22:58 广东

相关推荐

1.自我介绍2.大三有专业课怎么办(拿到offer可以请假)3.两篇软件著作权是哪两个项目(我说的是科研管理系统和微途旅行)4.简历里没有写科研管理系统这个项目(解释:主要是表现我个人有过项目合作经历)5.这个单点登录怎么做的?6.你们科研系统的用户是怎么得到统一的用户?7.你们科研系统的审核是使用的工作流吗8.这个项目在技术框架上没有比较突出的点,所以没有写到简历里(解释了下这个项目,主要是业务方面的难度,更多是作为一个与他人合作的项目经历)9.在这个项目当中,你主要作为一个什么样的角色.10.项目团队是学校的兴趣组或者实验室吗11.介绍一下云智颐养项目(阿巴阿巴阿巴)12.云智颐养是一个什么性质的项目,项目团队成员配置,承担什么角色13.工作流是教程里就有的,还是自己增加的14.工作流的源码是否有研究过(没研究过,直接拉的代码)15.springai框架functioncalling用的是哪个模型16.functioncalling与mcp server的区别(不知道,只知道mcp是协议)17.了不了解functioncalling有什么限制18.xxl-job是怎样调度使用的,用在什么场景?19.xxl-job有哪些策略20.限制xxl-job秒级任务的性能的在哪里21.还有什么其他的项目可以介绍的?(介绍的微途旅行)22.这个项目的需求是竞赛规定的还是自己想出来的23.前端是用ai工具做的,貌似ai其实有些样式不是很好调,那你这边是会前端吗24.为什么第二个项目用的springai,这个用的lanhchain4j,有什么区别,你觉得在使用上你更喜欢哪个,为什么更喜欢langchain4j25.为什么使用了redis和lua脚本已经判断下单校验了,后面数据库校验还要加乐观锁26.秒杀门票时,门票数量有变更时怎么做到27.秒杀有没有考虑过有用户下单了,但是没有支付成功或者没支付,怎么处理这个redis里库存已经扣减的情况28.秒杀过程中有人点击速度很快,怎样防止用户重复提交购买29.如果合适的话什么时候可以到岗,大三大四只有期末或者毕业设计会回去是吧?反问:1.公司是自研,低代码还是二开(公司自研的低代码平台,说比若依更强一些,简单的业务用框架完成,大部分稍微复杂的业务还是用自己写代码实现)2.公司的业务是承接外面的还是有自己的(一般是承接地铁和农产品行业相关的)3.公司的开发项目组人员配置(看项目类型和大小,一般是1比1,每个项目有一个测试,大的项目有十几个人,大部分项目是4,5,6个人)
查看26道真题和解析
点赞 评论 收藏
分享
今天老师为大家梳理了10道RAG大模型必备面试题,供各位同学参考。1️⃣Q1:如何评估RAG生成结果的质量?A1:① 事实准确性(Factual Accuracy):对比标准答案;② 引用精确度(Citation Precision):生成内容与引用文档的相关性;③ ROUGE/L等自动指标(需谨慎,可能与事实性脱钩)。2️⃣Q2:如何优化检索的召回率(Recall)?A2:① 使用Query扩展(同义词替换/LLM改写);② 多向量表示(HyDE生成假设文档再检索);③ 调整分块策略(重叠分块/多粒度分块)。3️⃣Q3:RAG如何处理多文档冲突信息?A3:①  让LLM总结共识点并标注分歧(提示词控制);② 按文档来源权威性加权(如医学指南>普通文章);  ③ 返回多视角答案(需明确说明冲突存在)。4️⃣Q4:如何解决“检索偏好”问题(Retrieval Bias)?A4:当检索结果质量差时强制生成会导致错误。解决方案:① 训练检索评估模块过滤低质结果;② 引入回退机制(如返回“无答案”);③ 迭代检索(Re-Rank或多轮检索)。5️⃣Q5:如何优化长文档检索效果?A5:① Small-to-Big检索:先检索小分块,再关联其所属大文档;② 层次检索:先定位章节,再章节内分块检索;③ 图结构:用知识图谱关联文档片段。6️⃣Q6:解释HyDE(Hypothetical Document Embeddings)原理?A6:让LLM根据Query生成假设性答案,将其作为“伪文档”嵌入向量,再用该向量检索真实文档。解决Query与文档表述差异问题。7️⃣Q7:什么是迭代检索(Iterative Retrieval)?A7:多轮检索:首轮检索结果输入LLM生成初步答案,再以该答案为新Query二次检索,循环直到满足条件。适合复杂推理场景。8️⃣Q8:Self-RAG的核心创新点是什么?A8:引入可学习检索信号:模型自主决定何时检索(Retrieve on Demand),并生成特殊Token(如[Retrieval]、[No Retrieval])控制流程。9️⃣Q9:RAG如何适配实时更新知识库A9:① 检索器使用近实时索引(如Elasticsearch增量更新);② 生成器无需重训,但需监控新数据分布偏移。1️⃣0️⃣Q10:用户查询“2025年诺贝尔奖获得者”,但知识库只更新到2024年,RAG如何应对?A10:设计策略:① 检索器返回最新文档(2024年);② 生成器明确回答“截至2024年数据,最新获得者为XX,2025年结果尚未公布”;③ 添加时间敏感性警告。🍊如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
点赞 评论 收藏
分享
评论
4
17
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务