03-21 04:30 门头沟学院 Java

关注

字节大模型应用开发二面日常实习

发点面经攒攒人品～
1.实习介绍
2.拷打第一个项目
3.拷打第二个项目
4.在向量化之前，为什么要对长文档进行切片？如果不切片会有什么后果？
5.切片时设置重叠区域的作用是什么？这个比例你通常怎么来确定？
6.讲一下稠密向量与稀疏向量的区别，分别适合处理什么样的搜索需求？
7.向量库检索出的Top-K结果，如果K值设置得过大，对后续的生成质量有哪些负面影响？
8.余弦相似度和欧氏距离在衡量文本相似性时，各自的优缺点是什么？
9.为什么在初筛召回之后，还要加一个Rerank模型？它能解决向量搜索的哪些局限？
10.如果文档发生了局部更新，如何通过增量索引来避免全量重新向量化？
11.在RAG的生成阶段，如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉？
12.了解HyDE吗？介绍一下原理，它在处理模糊提问时有哪些优势？
13.随着超长上下文模型的出现，你认为传统RAG架构的必要性是否降低了？
14.你了解哪些大模型推理框架？SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势？
15.调用大模型API时，为什么要使用asyncio异步编程？它在处理高并发请求时有何优势？
16.针对大规模PDF解析这种任务，你选择多线程还是多进程？
17.如何确保Agent返回的结果是标准的JSON格式？如果模型输出中有多余的说明文字，你在后端如何提取？
18.场景题：对于RAG，如果检索到了针对同一故障的两份手册，内容相互冲突，请你设计一套逻辑，让模型能够识别冲突并优先选择时效性更高的信息？
19.手撕：第k大元素

全部评论

推荐最新楼层

04-15 13:45

北京邮电大学 Java

阿里云 4.13 大模型应用开发一面

项目提问，为什么选择这个任务，开发中遇到什么问题，自己怎么解决的？项目开发中技术栈的选择和开发流程。 项目中你做了一些优化，有没有和旧策略进行对比，具体有哪些提升？ 介绍下prompt工程，你了解prompt自动化吗？ 介绍下sft，它是怎么做的，有什么衡量指标 rag知识库怎么搭的？向量维度的选择，embedding模型的选择 java里HashMap的底层实现，什么时候转为红黑树，为什么转红黑树策略这样设置，HashMap的key有什么要求（实现hashcode和equals） 编程题：java实现用一个标记位实现一个锁。和面试官说了不会，换成了K个一组翻转链表。

查看9道真题和解析

点赞评论收藏

分享

04-21 19:15

东南大学深度学习

研一想转大模型开发

双非本，985女硕，非科班想转码大模型应用开发，不是算法，Python差不多快学完了，传统工科专业，但课题方向和大模型有关系，最头疼的问题是导师不放实习，每周组会，可能只能在南京找个中小厂偷偷实习，或者可能没实习，对于秋招offer，我不求能去大厂，也没希望，努力争取中厂，薪资只求有30w，我不知道有没有希望，我本专业的薪资实在不理想

点赞评论收藏

分享

05-05 20:51

三江学院 C++

AI Agent面经 2（持续更新）

Q1：prefix Decoder 和 causal Decoder 和 EncoderDecoder 区别是什么？答案：prefix Decoder 和 causal Decoder 和 Encoder-Decoder 区别在于 attention mask不同：Encoder-Decoder：在输入上采用双向注意力，对问题的编码理解更充分。适用任务：在偏理解的 NLP 任务上效果好。缺点：在长文本生成任务上效果差，训练效率低。causal Decoder：自回归语言模型，预训练和下游应用是完全一致的，严格遵守只有后面的token才能看到前面的token的规则。适用任务：文本生成任务效果好。...

查看3道真题和解析

点赞评论收藏

分享

04-17 16:25

门头沟学院算法工程师

蚂蚁大模型应用开发一面分享

整体面试还是不错的，但是没后续了，不知道是哪里出了问题1.RAG的核心流程2.向量嵌入模型的选型3.多模态和文本在向量嵌入的时候存在什么区别4.Agent的核心组件5.Agent框架，应用场景6.大模型训练的过程7.Agent场景题（开发SQL查询 Agent），怎么设计，存在的问题，怎么解决8.AI coding场景题9.最近有没有压力特别大的事情，怎么解决的10.自我评价一下自己有哪些不足无手撕，无AI coding

查看10道真题和解析

点赞评论收藏

分享

04-17 08:55

广西大学算法工程师

影石 AI开发一面(日常)

1. 自我介绍2. TCP 和 IP 的职责边界是什么，为什么说“HTTP 基于 TCP，TCP 基于 IP”这个表述只对了一半IP 负责尽力而为地把报文从源地址送到目标地址，它不保证到达、不保证顺序，也不保证不重复。TCP 建立在 IP 之上，提供有连接、可靠传输、流量控制、拥塞控制和按序交付。HTTP 是应用层协议，它依赖传输层提供的可靠字节流，但 HTTP 本身并不“知道”底下是不是 TCP，也可以跑在 QUIC 上。所以“HTTP 基于 TCP”对传统 HTTP/1.1 和 HTTP/2 是对的，但对 HTTP/3 就不成立；“TCP 基于 IP”则更准确，因为 TCP 的寻址和转发确...

AI-Agent面试实战...

点赞评论收藏

分享

评论

4

32

全站热榜

更多

创作者周榜

更多

正在热议

更多

# 你的实习产出是真实的还是包装的？ #

88832次浏览 639人参与

# 简历当中有水分算不算造假？ #

176488次浏览 2330人参与

# 在爱玛，骑向未来 #

44656次浏览 436人参与

# 打工人的精神状态 #

154572次浏览 1551人参与

# 你以为的实习VS真实的实习 #

142715次浏览 758人参与

# 职场新人体验 #

192831次浏览 1241人参与

# 备战春招/暑实，现在应该做什么？ #

70289次浏览 557人参与

# 距离春招还有一个月，你现在是什么开局？ #

62838次浏览 320人参与

# 银行笔面经互助 #

198541次浏览 1326人参与

# 应届生，你找到工作了吗 #

174155次浏览 900人参与

# 工作后，你落下了哪些病根 #

42413次浏览 294人参与

# 你被哪些公司挂了？ #

198285次浏览 1077人参与

# 机械人，秋招第一次笔试的企业是哪家？ #

103521次浏览 707人参与

# 机械人，说说你的烦心事 #

148673次浏览 1164人参与

# 工作压力大，你会干什么？ #

82537次浏览 708人参与

# 国企还是互联网，你怎么选？ #

218490次浏览 1541人参与

# 选offer应该考虑哪些因素 #

172585次浏览 1057人参与

# 26届秋招公司红黑榜 #

86200次浏览 287人参与

# 你上一次加班是什么时候？ #

157551次浏览 823人参与

# 实习生工资多少才算正常？ #

76605次浏览 528人参与

# 哪一瞬间让你觉得工作好累 #

87870次浏览 443人参与

牛客网
牛客网在线编程
牛客网题解
牛客企业服务