日常实习-腾讯文档-一面凉经
📍面试公司:腾讯-腾讯文档(wh)
🕐面试时间:26.3.6
💻面试岗位:后台开发
❓面试问题:
1、自我介绍?
2、网络安全论文的方向?
智能问答系统:
3、智能问答系统-RAG的执行流程什么?
4、为什么使用混合检索?为什么水利专业词汇需要关键词来检索,直接用向量检索不行吗?
5、RAG的文档内容主要是什么?
6、听我说只选Top1,为什么不选前三个或者前五个呢?
7、文档切片是怎么做的?(回答了一下语义分块)
8、那语义分块实现一句句的话,上下文就不完整了,这一块你们是怎么做的?(回答的是父子索引或者检测句子之间的语义是否相似)
9、那如何检测上下相邻之间的句子的语义相似度呢?是每一次将上次合并的段计算还是一直一句一句的合并?
10、将切片后的文档Embeeding是怎么实现的?
11、项目中的混合检索得分是怎么做的?(回答最简单的alpha\1-alpha)
12、那alpha是如何确定的呢?是测试了几个然后感觉还可以就用了吗?
13、关键词检索得分是怎么做的?
14、你知道RAG的rerank模型吗?这个项目中使用了吗?(回答这个没用到)
15、有没有在测试的过程中发现系统的什么问题?比如说回答的不太准确之类的?(回答了比较小的地名没有被分词成功,没有检测出对应的文档,使用IK分词器添加了专有的名词库,才能让这些专有分词成功)?
16、如果上线的话,如何确保项目的交付质量?(暂时还没详细确定)
17、那你觉得这个项目交付可以使用那些指标?
18、多轮对话的上下文记忆是怎么做的呢?
19、自我介绍的时候说的NL2SQL是什么?介绍一下?
黑马点评
20、这个是上线了的还是自学的项目?
21、为什么使用Lua脚本来实现库存校验呢?
22、乐观锁防止超卖是如何实现的?
23、Cache Aside模式是什么?(这个好像没答好)
24、如果缓存失效之后,有很高并发的访问的话,能扛得住吗?(缓存击穿,缓存穿透)
25、如果缓存失效之后,那用户不是获取不到值了吗?(使用逻辑过期时间)
手撕:第K大的数(但是我用的是快速排序实现的)
🙌面试感想:
寒假之后第一次面大厂,面试官人还是不错的,但是有点像KPI面,这个岗位很早就发布了,面试官开了下摄像头之后又关闭了。
不过对RAG项目确实需要再了解一下,优化下对应的解决方案。
#发面经攒人品##27届求职交流#
查看15道真题和解析