字节 大模型应用开发实习一面 1h

给我面没招了,发点面经攒攒人品~
1.实习拷打
2.拷打第一个项目
3.拷打第二个项目
4.在RAG中,递归字符切片相比固定长度切片优势在哪?
5.如果要实现只在特定分类的文档中进行检索,在Milvus中是使用多个Collection效率高,还是使用分区效率高?
6.什么是Agent的反思机制,对于你的心理咨询Agent,有没有让模型在回答前先检查一遍自己的语气是否专业?
7.工业图纸识别如果大模型出现了幻觉,你在Prompt层面或后处理层面有什么方法?
8.介绍一下Function Call原理,模型生成的JSON如何通过逻辑触发表层代码执行并返回给模型?
9.vLLM的PagedAttention原理?
10.在使用FastAPI开发大模型接口时,中间件和依赖注入分别适合处理什么样的业务逻辑?
11.Python的multiprocessing和threading你会如何结合使用来提高整体吞吐量?
12.asyncio.gather和asyncio.as_completed在并发请求多个模型接口时有什么区别?如果其中一个接口超时,如何做降级?
13.如果用户的Prompt特别长,导致上下文窗口溢出,除了截断,你有哪些简化上下文的策略?
14.了解目前主流的MultiAgent框架吗?如果将你的心理咨询Agent拆分,你认为状态同步的难点在哪?
15.谈谈对A2A通信的理解。在A2A场景下,如何防止两个Agent陷入递归对话?
16.手撕:实现LRU缓存机制,有时间复杂度要求
全部评论

相关推荐

04-18 11:56
门头沟学院 Java
1.mysqlb➕索引,字符怎么查找,支持顺序查找吗1.5 JAVA python线程模型2.java异步怎么做。fastapi底层异步怎么做。3.线程池策略,参数3.5线程数怎么设置。io密集型,假如最大设置为10,第11个来了怎么办。一般八核,线程数设为多大。像windows里面有很多线程,也是io密集,你觉得为啥没有崩溃之类的4.poll epoll了解吗5..java map结构一系列;线程安全,cas6.文件上传从8s优化到2s。哪个部分耗时,向量化还是上传,带宽跑满了吗,是什么限制了7.文件发到网卡,文件加载cpu到内存,用户态内核态怎么切换的,细致说下8.分片上传,是单线程的限制吗9.向量纬度768 1024区别,为啥这么选10.knn,ann时间复杂度11.PPT生成为啥不用文生图做。讲下完整流向rag结合prompt,填到限制槽位,结合固定样式生成12.多智能体改的架构,怎么上下文管理,传递消息,共享记忆13.agent记忆怎么做的14讲下渐进式披露,那永久记忆你觉得怎么查询,怎么操作,讲你的想法就行15.已经摘要了很多次,这个时候渐进式披露怎么做分层16.claude code 的harness跟其他agent区别17llm运行原理,transformer架构原理18.有微调过小模型吗clip blip,效果不好19.有用过Claude code做过大的或小的项目吗,用什么模型论文自动检索,自动视频生成,codex联合前后端并发编程检索最新ai动态20题目两个线程交替打印字母,数字结合面试官回答反问阿帕奇开源项目,技术相关对ai态度,开发或者学习永久记忆是否可以蒸馏一个个体是否觉得机器人ai参数高到某个量级,也具有意识,或者意识这个词。
查看26道真题和解析
点赞 评论 收藏
分享
头像
04-23 15:28
南京大学 Java
攒人品ing~基本信息一、 项目深挖与常规问答自我介绍:面试官提问:挑一个花费时间最多、最重点的项目介绍,并罗列一两个难点。后续追问:目前项目的访问量多大?(如实回答目前仅作个人和朋友测试使用)。二、 计算机基础与后端八股操作系统与网络问题 1:Python多进程解决OOM问题,为什么不用多线程?问题 2:进程和线程在操作系统层面的核心区别是什么?问题 3:FastAPI 服务端延迟极低,客户端发起请求时,TCP 建立连接的过程是怎样的?问题 4:项目中实现在线推送为什么使用 WebSocket 而不用 HTTP 轮询?JVM 基础问题 1:Java 程序运行时,JVM 内存分为哪几块?问题 2:堆里的对象是一定会被回收的吗?问题 3:引用类型会被回收吗?Redis问题 1:项目中的布隆过滤器、互斥锁、逻辑过期分别是解决什么问题的?问题 2:逻辑过期和物理过期的区别是什么?问题 3:HyperLogLog、ZSet、Bitmap 的底层原理和适用场景是什么?问题 4:场景题:如何统计最近七天内每天都活跃的日活用户交集?消息队列 (RabbitMQ)问题 1:如何保证消息百分之百入库?描述消息从生产到消费的完整可靠链路。问题 2:死信队列里面是怎么处理的?问题 3:怎么保证消息的幂等性?数据库 (MySQL)问题 1:索引场景题:有用户表、签到表(自增ID,user_id,签到时间,状态),要查某个用户某个月的签到记录,怎么加索引?问题 2:如果不用 Redis,直接在 MySQL 层面避免高并发下的重复点赞,怎么设计?问题 3:如果并发量很大,使用乐观锁和悲观锁的区别?使用悲观锁有什么问题?三、 算法与代码手撕题目 1:实现 `O(1)` 时间复杂度的 LRU 缓存题目 2:合并 K 个升序链表四、 AI 与大模型工程问题 1:RAG(检索增强生成)的工作流分哪几步?问题 2:RAG 知识库生成的步骤是什么?问题 3:向量检索时,怎么判断相似度?问题 4:你项目里的 Agent 架构是怎么设计的?五、 反问环节提问:如果有幸入职,主要会做哪些工作?难点在哪里?提问:腾讯内部对使用 AI 辅助编程的态度是什么?提问:对我今天的面试表现有什么评价或建议?
雾已散声宜慢:后续:已约二面
查看28道真题和解析
点赞 评论 收藏
分享
04-08 17:10
门头沟学院 Java
给我面麻了,发下面经攒攒人品1.TCP/IP 协议有几层?TCP 属于哪一层?TCP 是基于 IP 的,还是 IP 是基于 TCP 的?2.HTTP/HTTPS区别3.SSL/TLS工作原理4.Java 里面 ArrayList 和 LinkedList 有什么区别?5.JVM 的内存结构包括哪几个区?6.你对软件开发过程有了解吗?7.在软件开发流程里,如果想用 AI 提效,你觉得哪些环节可以做?8.监督学习和非监督学习有什么区别?9.所有大模型都支持工具调用吗?10.常用模型里,比如 GPT,支持工具调用吗?11.Claude 用过吗?是否支持工具调用?12.什么是 Skill?13.为什么它能节省上下文?14.它检索到的“相关部分”具体是什么?15.如果装了很多个 skill,llm怎么知道该用哪个?16.如果把所有 skill 都打开看,那上下文是不是就会爆掉?17.你知不知道什么是渐进式加载?18.function call 的原理你知道吗?19.大模型是怎么去调用 function call、又是怎么执行的?20.比如我本地写了一个 Java 进程并配好了入参、出参和描述,大模型会直接去运行这个 Java 函数吗?21.MCP 是一种协议吗?22.A2A 这种协议你听说过吗?是什么23.MCP 是什么,是控制什么的?24.你说 MCP 可以决定调用哪个方法,这里的“决定”是指大模型决定吗?25.你刚刚说的 MCP 和 A2A,它们分别是做什么的?区别是什么?26.实习里多 Agent / 单 Agent 取舍,你们做成多 Agent 之后,这个方案还有什么问题吗?系统还有没有什么问题?27.你自己有没有在业余用 AI 做一些东西?28.你平时有没有通过一些比较官方的渠道去了解 AI 的进展?29.Claude 这个模型你知道吗?30.Claude 最新版本现在是多少?31.GPT 最新版本是多少?32.GPT 5.4 和 5.3 有什么区别?33.Claude 4.6 现在的上下文长度是多少?
点赞 评论 收藏
分享
评论
6
21
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务