4.13 阿里云技术线一面
一开始手撕了一个LFU-LRU混合缓存,然后撕了一半发现不太对,不知道如何处理相同频率的数据如何再根据LRU进行淘汰,最后也没有提示直接基于该手撕问了一些问题:
1. 比如说你实现的这套是一个正常的版本,在多线程并发场景下,你觉得这套实现会有什么问题?
2. 那对应的优化方案呢?要解决这个问题,你有什么思路?
3. 锁怎么加?你刚说给 Key 加锁,大致来看锁具体怎么加?比如我们用的是个什么样的锁?
4. 那当前这个缓存服务,比如说我最终要在实验室或者合作项目里把它变成一个可用的服务,这里面一定会涉及到物理瓶颈的问题,针对现在你所了解的、能解决缓存需求的解决方案,目前有哪些?
5. 你有深入了解过 Redis 的大概系统架构吗?
6. 它为什么能够胜任电商场景下的高并发需求?它有什么核心特点?(基于内存)
7. 除了这个原因呢?(io多路复用)
8. 那关于缓存击穿,你是怎么理解的?
9. 那在你的理解和项目实践中,针对缓存击穿问题你是怎么解决的?
10. 这里面我看你写到也尝试使用了 Lua 脚本,为什么这个场景会用 Lua 脚本?什么情况下用它,什么情况不用它?
11. 我看你最新的项目还是和 AI 相关的,这块你可以讲一下你觉得有意思的部分吗?
12. 以你当前的情况来看,你知识库的召回率是怎么判定的?比如你里面写了 80%,这个值是怎么来的?
13. 这个占比是怎么判定的?比如你标记的正确答案是几条,召回是怎么召回的,麻烦讲得细一点,比如这个占比具体怎么算?
14. 不是按单个 query 去分别判定的是吗?是根据整个召回的结果,比如每一个 query 你都会计算占比,然后把这些占比加合求平均,是这样吗?
15. 其实你刚刚讲到了一些关键细节,比如分片、重排,你做分片的考量是什么?比如你当前的分片方式存在什么问题?可以怎么去优化?
16. 有没有想过非 Markdown 格式的文档要怎么处理?
17. 这里面你的索引选型是怎么考虑的?还是说因为你用了 Spring Cloud Alibaba 的框架,就直接用了它的默认构建方式?
18. 这里面其实有几个细节,你的向量模型是怎么选的?还有向量维度,比如你定了 1024 维,包括模型版本、向量数据库选型,这些你有做相关的考量吗?
19. 你刚刚其实有讲到关于上下文和 memory,你觉得在你的这个小的尝试里,当前默认提供给你的套件,在上下文和 memory 这块有什么问题?针对你遇到的问题,你有什么优化想法?
20. 整个 Agent 的搭建,你一共花了多少时间?
21. 我看你最开始介绍的研究方向是时空数据预测,更偏向理论研究,平时的工作主要是设计模型、训练测试,但你的项目又偏工程相关,你个人对于工程和理论研究,有比较确定的偏好吗?
22. 比如在 Agent 这个项目里,你觉得比较感兴趣的工作是哪一块?
#暑期实习##面经#
1. 比如说你实现的这套是一个正常的版本,在多线程并发场景下,你觉得这套实现会有什么问题?
2. 那对应的优化方案呢?要解决这个问题,你有什么思路?
3. 锁怎么加?你刚说给 Key 加锁,大致来看锁具体怎么加?比如我们用的是个什么样的锁?
4. 那当前这个缓存服务,比如说我最终要在实验室或者合作项目里把它变成一个可用的服务,这里面一定会涉及到物理瓶颈的问题,针对现在你所了解的、能解决缓存需求的解决方案,目前有哪些?
5. 你有深入了解过 Redis 的大概系统架构吗?
6. 它为什么能够胜任电商场景下的高并发需求?它有什么核心特点?(基于内存)
7. 除了这个原因呢?(io多路复用)
8. 那关于缓存击穿,你是怎么理解的?
9. 那在你的理解和项目实践中,针对缓存击穿问题你是怎么解决的?
10. 这里面我看你写到也尝试使用了 Lua 脚本,为什么这个场景会用 Lua 脚本?什么情况下用它,什么情况不用它?
11. 我看你最新的项目还是和 AI 相关的,这块你可以讲一下你觉得有意思的部分吗?
12. 以你当前的情况来看,你知识库的召回率是怎么判定的?比如你里面写了 80%,这个值是怎么来的?
13. 这个占比是怎么判定的?比如你标记的正确答案是几条,召回是怎么召回的,麻烦讲得细一点,比如这个占比具体怎么算?
14. 不是按单个 query 去分别判定的是吗?是根据整个召回的结果,比如每一个 query 你都会计算占比,然后把这些占比加合求平均,是这样吗?
15. 其实你刚刚讲到了一些关键细节,比如分片、重排,你做分片的考量是什么?比如你当前的分片方式存在什么问题?可以怎么去优化?
16. 有没有想过非 Markdown 格式的文档要怎么处理?
17. 这里面你的索引选型是怎么考虑的?还是说因为你用了 Spring Cloud Alibaba 的框架,就直接用了它的默认构建方式?
18. 这里面其实有几个细节,你的向量模型是怎么选的?还有向量维度,比如你定了 1024 维,包括模型版本、向量数据库选型,这些你有做相关的考量吗?
19. 你刚刚其实有讲到关于上下文和 memory,你觉得在你的这个小的尝试里,当前默认提供给你的套件,在上下文和 memory 这块有什么问题?针对你遇到的问题,你有什么优化想法?
20. 整个 Agent 的搭建,你一共花了多少时间?
21. 我看你最开始介绍的研究方向是时空数据预测,更偏向理论研究,平时的工作主要是设计模型、训练测试,但你的项目又偏工程相关,你个人对于工程和理论研究,有比较确定的偏好吗?
22. 比如在 Agent 这个项目里,你觉得比较感兴趣的工作是哪一块?
#暑期实习##面经#
全部评论
面多久出结果 蹲后续
相关推荐
查看16道真题和解析