字节 大模型应用开发 二面 日常实习

发点面经攒攒人品~
1.实习介绍
2.拷打第一个项目
3.拷打第二个项目
4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?
5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?
6.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?
7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?
8.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?
9.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?
10.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?
11.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?
12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?
13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?
14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?
15.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?
16.针对大规模PDF解析这种任务,你选择多线程还是多进程?
17.如何确保Agent返回的结果是标准的JSON格式?如果模型输出中有多余的说明文字,你在后端如何提取?
18.场景题:对于RAG,如果检索到了针对同一故障的两份手册,内容相互冲突,请你设计一套逻辑,让模型能够识别冲突并优先选择时效性更高的信息?
19.手撕:第k大元素
全部评论

相关推荐

感觉面完人都通透了,还是太菜了,下去沉淀一下1.redis和lua实现库存防超卖和一人一单,redis用lua的方式和使用2.redis本身的事务特性的方式的区别是什么?为什么不用redis本身的事务特性做防超卖?3.redis的set、get是原子性操作吗?用redis的set已经是原子性的了,为什么还需要使用lua脚本4.lua脚本过长会导致阻塞吗?5.怎么解决实际生产环境中防超卖导致的并发的吞吐量的问题呢?lua会阻塞,那怎么解决既要保证不重复下单又要保证吞吐量6.如果下单的时候,有一个单子在lua中判断秒杀资格卡了很长时间,其他人操作点都点不了 ,会出现这种情况吗7.如果lua脚本中某一步出错异常了会怎么办8.lua脚本写了哪些功能9.布隆过滤器是怎么拦截无效查询的10.volatile关键字作用11.Lock锁的实现原理12.AQS原理13.spring的AOP原理是什么?14.如果是分布式系统,怎么解决分布式系统的事务一致性15.如果用消息队列,如果有一条消息没有及时处理,可能是对堆积了也可能是消息发送给系统但是系统繁忙给丢弃了,你会怎么做16.如果服务器处理任务有上限,不能及时处理新的消息,从消费者来说应该做什么处理17.如果系统繁忙,支付消息丢失了,客户没付钱,但是订单创建成功了,应该怎么后续弥补18.如果lua脚本中有abc三步操作,如果a成功b失败,工程层面上来讲系统应该怎么设计,怎么保证系统的鲁棒性?19.生产环境中抢一笔订单,抢到了但是因为系统的问题内部要做abc三个操作,在做b的时候可能网络抖了一下导致b操作异常,这时候要让客户重新点击一次吗?20.智能客服,使用redis支持会话记忆,agent中会话记忆有几种记忆管理?21.向量数据库中怎么保证获取到的数据是尽量有效且准确的,而不是一些无用的数据22.用向量相似性完成rag召回一般用什么算法23.你了解skill吗?自己写过吗?24.有prompt,为什么引入skill处理25.Ai coding用过吗?ai coding现在有个spec coding,sdd的研发模式,这是一种什么样的概念26.你现在用的ai coding工具有哪些
查看25道真题和解析
点赞 评论 收藏
分享
评论
4
32
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务