字节 大模型应用开发实习一面 1h

给我面没招了,发点面经攒攒人品~
1.实习拷打
2.拷打第一个项目
3.拷打第二个项目
4.在RAG中,递归字符切片相比固定长度切片优势在哪?
5.如果要实现只在特定分类的文档中进行检索,在Milvus中是使用多个Collection效率高,还是使用分区效率高?
6.什么是Agent的反思机制,对于你的心理咨询Agent,有没有让模型在回答前先检查一遍自己的语气是否专业?
7.工业图纸识别如果大模型出现了幻觉,你在Prompt层面或后处理层面有什么方法?
8.介绍一下Function Call原理,模型生成的JSON如何通过逻辑触发表层代码执行并返回给模型?
9.vLLM的PagedAttention原理?
10.在使用FastAPI开发大模型接口时,中间件和依赖注入分别适合处理什么样的业务逻辑?
11.Python的multiprocessing和threading你会如何结合使用来提高整体吞吐量?
12.asyncio.gather和asyncio.as_completed在并发请求多个模型接口时有什么区别?如果其中一个接口超时,如何做降级?
13.如果用户的Prompt特别长,导致上下文窗口溢出,除了截断,你有哪些简化上下文的策略?
14.了解目前主流的MultiAgent框架吗?如果将你的心理咨询Agent拆分,你认为状态同步的难点在哪?
15.谈谈对A2A通信的理解。在A2A场景下,如何防止两个Agent陷入递归对话?
16.手撕:实现LRU缓存机制,有时间复杂度要求
全部评论

相关推荐

昨天 04:30
门头沟学院 Java
发点面经攒攒人品~1.实习介绍2.拷打第一个项目3.拷打第二个项目4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?9.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?10.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?11.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?16.针对大规模PDF解析这种任务,你选择多线程还是多进程?17.如何确保Agent返回的结果是标准的JSON格式?如果模型输出中有多余的说明文字,你在后端如何提取?18.场景题:对于RAG,如果检索到了针对同一故障的两份手册,内容相互冲突,请你设计一套逻辑,让模型能够识别冲突并优先选择时效性更高的信息?19.手撕:第k大元素
查看19道真题和解析
点赞 评论 收藏
分享
评论
1
3
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务