数坤Agent一面

📍面试公司:数坤科技

🕐面试时间:4.15(1h左右)

💻面试岗位:实习算法工程师

❓面试问题:
1.自我介绍
2.项目介绍,用代码/伪代码介绍项目数据流
3.你的agent项目是如何评估的?
4.rag的召回指标如何评估?
5.如何知道chunk是不是你的目标chunk?只能人为标注?能不能自动化完成?
[补充]如何写好一份prompt?
6.rag效果不好怎么办?微调?成本太高怎么办?prompt工程?小模型提示词写好之后依然对有些数据效果好,有些数据不好,怎么办?除了微调,换模型,还有什么?
7.KV cache原理?为什么不存Q?
8.数据漂移怎么办?哪些参数影响模型推理阶段回答的稳定性?如何影响?

手撕: 开根号

反问: 组内业务/人数,作息时间

🙌面试感想:
有几个问题忘了,记性不太好。。想起来会补充。面试官人挺好的,不过我回答问题啰啰嗦嗦又磕磕巴巴。。

#发面经攒人品#
全部评论
用代码/伪代码介绍项目数据流是什么?开屏幕共享看项目代码吗?
点赞 回复 分享
发布于 05-08 20:11 新加坡
手撕开根号,这个我貌似有刷到过,不过忘记怎么做的了,回头看看去
点赞 回复 分享
发布于 04-22 12:24 陕西
可以的,感觉问的还行
点赞 回复 分享
发布于 04-19 22:39 北京
感觉看着问的似乎不多
点赞 回复 分享
发布于 04-16 23:30 北京

相关推荐

05-04 01:25
门头沟学院 Java
攒攒人品!有面试过同岗的朋友欢迎评论区交流1. 拷打实习2. 并发搜索场景下,主线程起了多个子线程后,怎么和它们通信以知道任务全都做完了?3. 为了提速引入了 Kafka,但 Kafka 本身是异步组件,会不会反而导致任务流转变得更慢?4. 流量变大后,每个任务拆解并发大量消息,Kafka 会不会变成系统的性能瓶颈?(答了限流桶策略、结合业务使用频次限制)5. 扫表和用消息中间件(如 Kafka 双 Topic)管理长时任务状态,各自的优缺点是啥?6. 详细介绍一下你项目里的多智能体协同策略,三层 Agent(Root、Main/Fallback、Sub-Agent)是怎么互相配合流转的?7. 如果主 Agent 决定越过第二层直接调底层的子 Agent,上下文信息是怎么跨层传过去的?(答了通过解析 JSON 传递意图,并共用主线程/连接)8. 补充检索是如何评估数据质量并触发的?你怎么保证二次检索能搜到之前没搜到的内容?9. 怎么避免大模型检索到网上被 AI 批量生成的虚假垃圾数据(防止 GU 投毒)?10. 短期对话记忆和长期记忆分别是怎么提取和存储的?11. 怎么判断当前用户的提问需不需要去 RAG 里检索长期记忆?12. 为什么底层选用了 pgvector 做向量数据库,而不是其他的?13. 为什么在向量检索的基础上还要加 BM25 精确检索?具体解决了什么 bad case?14. 重排序(Rerank)是怎么做的?有没有设置低分阈值做提前过滤操作?15. 传统 CNN 有什么痛点?ResNet 让你印象深刻的核心思想是什么?16. 介绍你最近读过的五篇论文17. 平时拿到一个项目任务,你用 AI 辅助编程的工作流是怎么拆解的?18. 你的AIcoding提示词策略是怎么操作的?人工一般在哪个环节介入审核?
查看17道真题和解析
点赞 评论 收藏
分享
点赞 评论 收藏
分享
评论
1
9
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务