腾讯24暑期teg大模型算法面经

4.26更新:4.23HR面后进入录用评估,昨天已收到offer邮件!祝大家也早日收到满意的offer!#晒一晒我的offer#

—— —— —— —— —— —— —— —— —— ——

10分钟后更新:发面经真的会有好运!10分钟后状态就更新为HR面了

—— —— —— —— —— —— —— —— —— ——

#如何判断面试是否凉了#4.10初试,4.16复试后面试官让等HR电话,目前官网还是复试链接状态,慌得一批。。。
听说发面经有好运,许愿早日进HR面!

初试:(约50分钟)
1. 面试官介绍部门
2. 自我介绍
3. 聊简历
4. 八股
    Q:如何规范LLM的回答?
    A:1.SFT微调;2.上下⽂学习(prompt中给例⼦);3.涉及到专业领域时,使⽤RAG

    Q:RAG实现?
    A:1.分割文档 2.使⽤向量模型将文档转为向量(对⽐学习,双塔模型)3.将向量灌⼊向量数据库;4.将⽤⼾query转为向量,并在向量数据库中检索;5.设置距离阈值,将前n个最相关的结果给到大模型

    Q:Transformer中的⾃注意⼒?
    A:将每个token embedding与Wq,Wk,Wv相乘得到Q,K,V。对于每个token,计算其Q与所有token的K之间的点乘,通过softmax转为系数,与对应token的V相乘得到与该token的注意⼒。

    Q:Transformer中的Q与K点乘后,为什么要除以根号下dk?
    A:点乘当dk较⼤时,会导致结果较⼤,经过softmax后可能会导致梯度消失。除以根号下dk相当于正则化,防⽌梯度消失

    Q:SVM基本原理?
    A:最⼤化超平⾯和⽀持向量之间的margin

    Q:SVM是⼆分类模型,如何处理多分类问题?
    A:训练多个⼆分类SVM模型对应于每个类别,判断样本是否属于该类,最后根据每个模型结果的置信度得到结果

    Q:SVM是线性模型,如何处理⾼维问题?
    A:使⽤核函数对数据进⾏升维

5. 算法题:DFS模版题,较简单

6. 提问环节
    Q:有什么可以提⾼的地⽅?
    A:多了解模型微调

复试:
聊简历,一道算法题,20分钟结束
算法题:给定字符串,输出其中不包含重复元素的最长子串的长度
全部评论

相关推荐

1.自我介绍2.拷打项目:针对长短期记忆,讲讲你是如何设计记忆的提取、压缩与冲突更新机制的?如果检测到用户存在极端情绪,你的Agent如何在不中断对话流的前提下进行干预?3.讲一下稠密向量与稀疏向量的区别,分别适合处理什么样的搜索需求?4.在向量化之前,为什么要对长文档进行切片?如果不切片会有什么后果?5.切片时设置重叠区域的作用是什么?这个比例你通常怎么来确定?6.余弦相似度和欧氏距离在衡量文本相似性时,各自的优缺点是什么?7.向量库检索出的Top-K结果,如果K值设置得过大,对后续的生成质量有哪些负面影响?8.为什么在初筛召回之后,还要加一个Rerank模型?它能解决向量搜索的哪些局限?9.如果文档发生了局部更新,如何通过增量索引来避免全量重新向量化?10.在RAG的生成阶段,如何在Prompt中设定边界条件来防止模型在没搜到内容时产生幻觉?11.调用大模型API时,为什么要使用asyncio异步编程?它在处理高并发请求时有何优势?12.了解HyDE吗?介绍一下原理,它在处理模糊提问时有哪些优势?13.随着超长上下文模型的出现,你认为传统RAG架构的必要性是否降低了?14.你了解哪些大模型推理框架?SGLang相比vLLM的PagedAttention在推理延迟上有哪些优势?15.手撕:第k大元素20.反问📳对于想求职算法岗的同学,如果想参加高质量项目辅导,提升面试能力,欢迎后台联系。
查看16道真题和解析
点赞 评论 收藏
分享
评论
12
42
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务