小红书大模型实习一面 30分钟不到...

无算法五八股,就是聊了一下项目
1.实习介绍
2.项目细节介绍
3.项目:讲一下论文里的GRPO算法原理,为什么去掉KL散度,reward function怎么设置
4.项目:credit assignment怎么实施的
5.项目:agentic RL和普通的RL比最大的不同在哪里?
6.项目:你们评测模型用的指标有哪些,介绍一下
7.了解ReAct结构吗,介绍一下?
8.你主要做的是多模态方向的任务对吧,有做过一些文本方面的任务吗?
9.GRPO相比PPO、DPO等有什么优点?
10.反问
全部评论

相关推荐

05-04 01:25
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1. 拷打实习2. 并发搜索场景下,主线程起了多个子线程后,怎么和它们通信以知道任务全都做完了?3. 为了提速引入了 Kafka,但 Kafka 本身是异步组件,会不会反而导致任务流转变得更慢?4. 流量变大后,每个任务拆解并发大量消息,Kafka 会不会变成系统的性能瓶颈?(答了限流桶策略、结合业务使用频次限制)5. 扫表和用消息中间件(如 Kafka 双 Topic)管理长时任务状态,各自的优缺点是啥?6. 详细介绍一下你项目里的多智能体协同策略,三层 Agent(Root、Main/Fallback、Sub-Agent)是怎么互相配合流转的?7. 如果主 Agent 决定越过第二层直接调底层的子 Agent,上下文信息是怎么跨层传过去的?(答了通过解析 JSON 传递意图,并共用主线程/连接)8. 补充检索是如何评估数据质量并触发的?你怎么保证二次检索能搜到之前没搜到的内容?9. 怎么避免大模型检索到网上被 AI 批量生成的虚假垃圾数据(防止 GU 投毒)?10. 短期对话记忆和长期记忆分别是怎么提取和存储的?11. 怎么判断当前用户的提问需不需要去 RAG 里检索长期记忆?12. 为什么底层选用了 pgvector 做向量数据库,而不是其他的?13. 为什么在向量检索的基础上还要加 BM25 精确检索?具体解决了什么 bad case?14. 重排序(Rerank)是怎么做的?有没有设置低分阈值做提前过滤操作?15. 传统 CNN 有什么痛点?ResNet 让你印象深刻的核心思想是什么?16. 介绍你最近读过的五篇论文17. 平时拿到一个项目任务,你用 AI 辅助编程的工作流是怎么拆解的?18. 你的AIcoding提示词策略是怎么操作的?人工一般在哪个环节介入审核?
查看17道真题和解析
点赞 评论 收藏
分享
04-24 05:40
门头沟学院 Java
感觉面完人都通透了,还是太菜了,下去沉淀一下1.介绍一下agent实习的项目架构2.你刚才提到配合定会议那个是多 agent 架构,一共用了几个 agent?每个 agent 分别负责哪一块?3.在设计上,什么情况下你会用单 agent,什么情况下会用多 agent?4.多 agent 之间的数据传输或者通信一般是怎么做的?5.如果多个 agent 之间有并发的情况,你一般怎么处理?6.如果有多个 agent 同时去操作数据库或者文件,这种并发你怎么处理?7.如果它们是异步执行的,这边会考虑怎么做8.rag混合检索机制,是怎么实现的9.你们项目里有没有遇到幻觉问题?这个问题怎么减少、规避?10.你之前都开发过哪些工具 / function?11.你提到那个 self-refine / 自我修正,你做过哪些修正策略?12.如果 API 返回结果有字段缺失,或者有冗余内容,你会用这种方式处理吗?13.你对 MCP 了解多吗?有没有写过相关的 MCP?14.假设 agent 调工具失败了,一般怎么处理?15.你之前开发过 agent,怎么管理它的 context?16.你自己在做 AI coding 时,一般怎么用?有没有什么方法论?17.上线前主要是通过什么方式保证质量的?只是靠 code review 吗?18.除了简历上写的这些,你自己还用 AI coding 做过哪些项目?19.你刚才提到那个 omo / openspec的东西,是你自己的项目实践,还是从别的地方学来的?
查看19道真题和解析
点赞 评论 收藏
分享
评论
点赞
4
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务