4.13 阿里云技术线一面

一开始手撕了一个LFU-LRU混合缓存，然后撕了一半发现不太对，不知道如何处理相同频率的数据如何再根据LRU进行淘汰，最后也没有提示直接基于该手撕问了一些问题：

1. 比如说你实现的这套是一个正常的版本，在多线程并发场景下，你觉得这套实现会有什么问题？
2. 那对应的优化方案呢？要解决这个问题，你有什么思路？
3. 锁怎么加？你刚说给 Key 加锁，大致来看锁具体怎么加？比如我们用的是个什么样的锁？
4. 那当前这个缓存服务，比如说我最终要在实验室或者合作项目里把它变成一个可用的服务，这里面一定会涉及到物理瓶颈的问题，针对现在你所了解的、能解决缓存需求的解决方案，目前有哪些？
5. 你有深入了解过 Redis 的大概系统架构吗？
6. 它为什么能够胜任电商场景下的高并发需求？它有什么核心特点？（基于内存）
7. 除了这个原因呢？（io多路复用）
8. 那关于缓存击穿，你是怎么理解的？
9. 那在你的理解和项目实践中，针对缓存击穿问题你是怎么解决的？
10. 这里面我看你写到也尝试使用了 Lua 脚本，为什么这个场景会用 Lua 脚本？什么情况下用它，什么情况不用它？
11. 我看你最新的项目还是和 AI 相关的，这块你可以讲一下你觉得有意思的部分吗？
12. 以你当前的情况来看，你知识库的召回率是怎么判定的？比如你里面写了 80%，这个值是怎么来的？
13. 这个占比是怎么判定的？比如你标记的正确答案是几条，召回是怎么召回的，麻烦讲得细一点，比如这个占比具体怎么算？
14. 不是按单个 query 去分别判定的是吗？是根据整个召回的结果，比如每一个 query 你都会计算占比，然后把这些占比加合求平均，是这样吗？
15. 其实你刚刚讲到了一些关键细节，比如分片、重排，你做分片的考量是什么？比如你当前的分片方式存在什么问题？可以怎么去优化？
16. 有没有想过非 Markdown 格式的文档要怎么处理？
17. 这里面你的索引选型是怎么考虑的？还是说因为你用了 Spring Cloud Alibaba 的框架，就直接用了它的默认构建方式？
18. 这里面其实有几个细节，你的向量模型是怎么选的？还有向量维度，比如你定了 1024 维，包括模型版本、向量数据库选型，这些你有做相关的考量吗？
19. 你刚刚其实有讲到关于上下文和 memory，你觉得在你的这个小的尝试里，当前默认提供给你的套件，在上下文和 memory 这块有什么问题？针对你遇到的问题，你有什么优化想法？
20. 整个 Agent 的搭建，你一共花了多少时间？
21. 我看你最开始介绍的研究方向是时空数据预测，更偏向理论研究，平时的工作主要是设计模型、训练测试，但你的项目又偏工程相关，你个人对于工程和理论研究，有比较确定的偏好吗？
22. 比如在 Agent 这个项目里，你觉得比较感兴趣的工作是哪一块？
#暑期实习##面经#

4.13 阿里云技术线一面

全站热榜

创作者周榜