字节大模型应用算法岗三面面经

1.自我介绍
2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?
3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?
4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?
5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?
6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?
7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?
8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?
9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?
10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?
11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?
12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?
13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?
14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?
15.手撕:第k大元素
20.反问
📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
全部评论
感觉问的真的多啊,最后过了吗
点赞 回复 分享
发布于 04-02 22:53 北京
大佬有面经资料吗
点赞 回复 分享
发布于 04-02 14:20 北京

相关推荐

祝大家都能拿到满意的Offer!1.项目拷打2.你们这里说的分层混合编排式 Agent 架构设计是具体怎么做的3.我问一个就是你们在Routing那里,你会根据难度去做不同的一个处理,对吧?那你们这个难度是怎么划分的呢4.你刚才提到就是说,比方说如果刚开始有动态升级的一个范式,就是比方说这个任务刚开始被分配到了7B但是如果它在生成的过程当中,置信度或者说生成的结果它的置信度比较低,你们这个置信度是怎么生成的呢5.你们大概配备了多少个工具6.以风险评估为例,你们的输入输出分别是什么呢7.你的字段是什么8.比方说你说的收缩压这个字段,在用户的问题当中可能不会有这样的一个检测数据。那这种情况你们是怎么来处理呢9.我看到你这里有说在引入了应用层的MOE按照任务动态的激活专家路径,这个具体是怎么实现的呢10.这里就有个问题,我们针对不同的科室去训练一个微调专家,那你们是你们怎么训练的呢?怎么针对于不同科室去训练的,第二个问题就是逻辑上你们这个专家数量可不会少,然后你们的工作量会比较大,这个问题你们又是怎么解决的呢11.你们最终大概是用了多少个专家12.每个大概训练的数据量是多少呢13你们的这个70b模型用的是自己?从头开始预训练的吗?还是用的开源的14那你们医疗数据你们医疗数据的主要来源是在哪里呢?
查看14道真题和解析
点赞 评论 收藏
分享
评论
点赞
12
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务