快手商业化 Java后端 二面|面试官很nice

alt

面试总结:没有那种纯八股问题,都是偏向于情景题。看到面试官最后出了一道多叉树的题目,我以为是想直接刷人,但还是尽力去尝试了一下,最后也没做出来,面试官很nice,在答不上来的时候会引导我去思考,并在我回答正确的时候给与充分的肯定。

1.线程池工作过程

线程池的工作过程主要包括以下几个步骤:

(1) 线程池创建时会初始化一定数量的核心线程,等待任务。

(2) 当有新任务提交时,会首先判断当前运行的线程数是否小于核心线程数。如果小于,则创建新的线程来执行任务。

(3) 如果当前运行的线程数大于或等于核心线程数,则将任务放入队列中等待执行。

(4) 如果队列已满,且当前线程数小于最大线程数,则创建新的线程来执行任务。

(5) 如果队列已满,且当前线程数等于最大线程数,则执行拒绝策略。

(6) 当线程完成任务时,会从队列中取出新的任务来执行。

(7) 当线程空闲时间超过keepAliveTime,如果当前运行的线程数大于核心线程数,则这些线程会被停止。

2.线程回收机制

线程池的线程回收机制主要依赖于线程池的工作队列和keepAliveTime参数:

(1) 当线程池中的线程数量大于corePoolSize时,如果某线程空闲时间超过keepAliveTime,线程将被终止,直到线程池中的线程数不超过corePoolSize。

(2) 如果设置了allowCoreThreadTimeOut(true),则核心线程在空闲时间超过keepAliveTime后也会被回收。

(3) 线程池使用一个HashSet存储工作线程的引用,在工作线程退出时,它会被从线程池中移除。

(4) 在ThreadPoolExecutor的getTask()方法中,如果线程获取任务时超时,说明该线程可以被回收。

(5) 线程回收的过程是通过线程自己执行完run方法来实现的,而不是由外部强制中断。

这种机制可以在执行大量短期异步任务时,提高线程的复用性,避免频繁创建和销毁线程带来的开销。

3.为什么标记核心线程和非核心线程

区分核心线程和非核心线程主要有以下几个原因:

(1) 资源管理:核心线程代表了线程池在空闲时刻的最小线程数,可以保证线程池的快速响应能力。

(2) 性能优化:核心线程通常不会被回收,可以减少线程创建和销毁的开销。

(3) 弹性伸缩:通过调整核心线程数和最大线程数,可以实现线程池的动态伸缩,适应不同的负载情况。

(4) 任务优先级:核心线程可以优先处理任务,非核心线程则在任务量增大时才会被创建。

(5) 资源控制:可以通过控制核心线程数来限制系统资源的使用,避免创建过多线程导致系统负载过高。

这种设计使得线程池可以在保证基本性能的同时,根据实际负载情况动态调整,既保证了响应速度,又避免了资源浪费。

4.数据库相关的查询优化

数据库查询优化是一个复杂的话题,主要包括以下几个方面:

(1) 索引优化:

  • 为常用查询字段创建适当的索引
  • 避免过多索引,可能影响插入和更新性能
  • 使用复合索引时注意最左前缀原则
  • 避免在索引列上使用函数或进行运算

(2) SQL语句优化:

  • 避免使用SELECT *,只查询需要的字段
  • 使用EXPLAIN分析SQL执行计划
  • 善用LIMIT语句来限制结果集大小
  • 使用合适的JOIN方式(INNER JOIN, LEFT JOIN等)

(3) 表结构优化:

  • 选择合适的数据类型,如使用UNSIGNED INT代替INT
  • 适当进行表的垂直拆分或水平拆分
  • 使用合适的存储引擎(如InnoDB支持事务,MyISAM适合只读场景)

(4) 架构优化:

  • 使用读写分离
  • 采用分库分表策略
  • 使用缓存层(如Redis)减轻数据库压力

在实际优化中,需要根据具体的业务场景和查询模式来选择合适的优化策略。

5.Redis主从集群相关问题

(1) 主从复制机制:

  • 全量复制:slave首次连接master时,master会生成RDB文件发送给slave
  • 增量复制:master将新的写命令异步发送给slave
  • 断点续传:当主从连接断开后,可以从断点处继续复制

(2) 数据一致性问题:

  • Redis采用异步复制,可能存在数据不一致的情况
  • 可以通过wait命令来实现同步复制,但会影响性能

(3) 故障转移:

  • 使用Sentinel进行自动故障检测和转移
  • Sentinel通过投票机制选举新的master

(4) 读写分离:

  • 可以将读请求分发到slave节点,减轻master压力
  • 需要考虑数据一致性问题,可能读到旧数据

(5) 数据过期问题:

  • 主节点负责key的过期删除
  • 从节点不会主动删除过期key,而是等待主节点的DEL命令

(6) 数据持久化:

  • 主节点通常配置AOF持久化,从节点可以只配置RDB持久化
  • 需要权衡数据安全性和性能

在实际应用中,需要根据业务需求和系统规模来设计合适的Redis集群架构。

7.项目中比较精彩的点

缓存优化的考量

(1) 缓存预热:

  • 系统启动时,提前将热点数据加载到缓存中
  • 可以通过定时任务或者手动触发来实现

(2) 缓存更新策略:

  • 实现缓存和数据库的双写一致性
  • 可以采用先更新数据库,再删除缓存的策略
  • 使用消息队列来保证最终一致性

(3) 缓存穿透优化:

  • 对不存在的key也缓存null值,并设置较短的过期时间
  • 使用布隆过滤器来快速判断key是否存在

(4) 缓存击穿优化:

  • 对热点key使用互斥锁或分布式锁
  • 实现请求合并(hystrix request cache)

(5) 缓存雪崩优化:

  • 给缓存的失效时间添加随机值
  • 实现熔断机制,当缓存失效量突增时,暂停使用缓存

(6) 缓存降级:

  • 当缓存服务不可用时,直接返回默认值或旧数据
  • 实现服务降级,保证核心功能可用

8.缓存优化的细节

针对缓存优化的细节,可以从以下几个方面深入讨论:

(1) 缓存key的设计:

  • 使用有意义的前缀,便于管理和查找
  • 考虑key的长度,过长的key会增加内存使用
  • 对于复杂对象,可以使用哈希算法生成key

(2) 缓存粒度:

  • 细粒度缓存:缓存具体字段,减少缓存内容,但增加缓存操作次数
  • 粗粒度缓存:缓存整个对象,减少缓存操作,但可能缓存无用数据

(3) 缓存有效期:

  • 根据数据更新频率设置合适的过期时间
  • 对不同类型的数据设置不同的过期策略
  • 考虑使用滑动过期时间(每次访问都刷新过期时间)

(4) 缓存预加载:

  • 识别热点数据,在系统启动时预加载
  • 实现智能预加载,根据访问模式动态调整预加载策略

(5) 缓存更新机制:

  • 实现缓存更新的重试机制
  • 使用分布式锁来保证并发更新的正确性
  • 考虑使用异步更新来提高性能

(6) 缓存数据一致性:

  • 实现最终一致性策略,如延迟双删
  • 使用版本号机制来处理并发更新
  • 考虑使用 Canal 等工具实现数据库和缓存的同步

这些细节需要在实际应用中不断调优和验证,以达到最佳的性能和可靠性。

9.设计消息队列(MQ)

设计一个消息队列系统需要考虑很多方面,以下是一些关键点:

(1) 消息存储:

  • 使用高性能的存储引擎,如 RocksDB 或自研的 LSM 树存储引擎
  • 实现分段日志(Log Segment)存储方式,便于清理过期数据
  • 考虑内存映射文件(Memory Mapped File)提高I/O性能

(2) 高可用性:

  • 实现主从复制机制,保证数据不丢失
  • 设计 RaftPaxos 等一致性协议,实现leader选举
  • 实现故障自动转移(Failover)机制

(3) 高吞吐量:

  • 使用零拷贝(Zero-Copy)技术减少数据复制
  • 实现批量发送和消费机制
  • 使用异步I/O提高并发性能

(4) 消息可靠性:

  • 实现消息确认(ACK)机制
  • 支持消息重试和死信队列
  • 实现幂等消费,处理重复消息

(5) 扩展性:

  • 设计分区(Partition)机制,支持横向扩展
  • 实现动态扩缩容能力
  • 支持多数据中心部署

(6) 消息顺序性:

  • 实现分区内的顺序消费
  • 支持全局顺序消费的特性

(7) 消息模型:

  • 支持发布/订阅模型
  • 支持点对点队列模型
  • 考虑支持延迟队列、优先级队列等特性

(8) 客户端SDK:

  • 设计简单易用的API
  • 实现自动重连、负载均衡等特性
  • 支持多种编程语言

实际情况还需要根据具体需求和场景进行取舍和优化。

11.使用消息队列的好处

(1) 异步处理:

  • 将耗时操作异步化,提高系统响应速度
  • 实现生产者和消费者的解耦,提高系统灵活性

(2) 流量削峰:

  • 缓冲突发流量,保护后端系统
  • 实现请求的平滑处理,提高系统稳定性

(3) 解耦系统:

  • 降低系统间的直接依赖
  • 提高系统的可扩展性和可维护性

(4) 扩展性:

  • 易于横向扩展,提高系统处理能力
  • 支持动态扩缩容,适应业务变化

(5) 可靠性投递:

  • 保证消息至少被消费一次
  • 支持消息重试机制,提高系统容错能力

(6) 顺序保证:

  • 在特定场景下保证消息的顺序性
  • 满足某些业务的顺序处理需求

(7) 流量控制:

  • 实现背压(back-pressure)机制
  • 控制消息生产和消费的速率,保护系统

(8) 事务消息:

  • 支持分布式事务
  • 保证跨系统操作的一致性

12.Redis使用场景

(1) 缓存:

  • 热点数据缓存,减轻数据库压力
  • 页面缓存,提高网站访问速度

(2) 计数器:

  • 高并发计数,如文章阅读量、点赞数
  • 限流计数,实现接口访问频率控制

(3) 分布式锁:

  • 实现跨进程、跨服务器的互斥操作
  • 控制并发访问,保证数据一致性

(4) 会话存储:

  • 存储用户会话信息,实现分布式 Session
  • 提高系统可扩展性,便于水平扩展

(5) 排行榜:

  • 使用Sorted Set实现实时排行榜
  • 高效的数据结构,支持大规模数据

(6) 消息队列:

  • 利用List实现简单的消息队列
  • 适用于轻量级的异步任务处理

(7) 分布式ID生成:

  • 利用INCR命令实现全局唯一ID
  • 高性能,适用于高并发场景

(8) 布隆过滤器:

  • 使用Bitmap实现布隆过滤器
  • 用于大规模数据的快速判重

(9) 延迟队列:

  • 利用Sorted Set实现延迟任务
  • 用于定时任务、订单超时处理等场景

13.Redis实现分布式锁

Redis 实现分布式锁的基本步骤如下:

(1) 获取锁: 使用 SETNX 命令尝试设置一个键值对,如果键不存在则设置成功并获得锁:

(2) 设置过期时间: 为了防止客户端崩溃导致锁无法释放,需要设置过期时间

(3) 执行业务逻辑

(4) 释放锁: 使用 Lua 脚本保证原子性,只有持有锁的客户端才能释放锁:

注意事项:

  • 使用唯一值标识锁的持有者,防止误释放
  • 设置合理的过期时间,避免死锁
  • 考虑使用 Redisson 等成熟的实现,它们提供了自动续期等高级特性

这种实现方式适用于简单场景,但在高并发或对可靠性要求较高的场景下,建议使用Redisson等专业的分布式锁实现。

15.普通 Redis 锁与 Redisson 的区别

Redisson 是一个在 Java 客户端上使用 Redis 的工具库。它提供了一个易于使用且强大的一套 API,来简化分布式系统的开发。Redisson 提供了多种分布式锁机制,比如公平锁、读写锁、红锁等,适合各种不同的场景,帮助开发者解决并发控制问题。

redis 锁的局限性

  1. 单Redis实例
    • 这种锁机制在单一 Redis 实例环境下工作良好,但在集群环境下可能会面临问题。
  2. 没有自动续期
    • 锁的持有者必须自己管理锁的续期,以防锁被意外释放。
  3. 原子性限制
    • 在解锁时需要小心,因为 DEL 命令在分布式系统中可能会删除不是自己设置的锁。

Redisson 锁

  1. 更高层次的抽象
    • Redisson 提供了类似 Java 原生 java.util.concurrent.locks.Lock 接口的抽象,让使用锁变得更加自然和简单。
  2. 内置功能
    • 公平锁、读写锁、可重入锁、红锁(一种分布式环境下的锁)等多种锁实现。
    • 内置续期机制:锁的持有者可以自动续期,防止锁误释放。

Redisson 锁的优势

  1. 适用性广
    • 同时适用于单实例和分布式集群环境,可以处理更复杂的分布式锁需求。
  2. 简化开发
    • 提供了接口级别的锁实现,更易于集成到现有项目中,并支持自动续期和更复杂的锁策略。
  3. 高可用性
    • 支持 Redis 的集群、哨兵模式和主从模式,提供高可用性。

16.Redission 相关问题

(1) 是否会产生死锁

Redisson 锁在设计上考虑到避免死锁。它通过设置锁的过期时间和自动续期机制来防止持有锁的节点意外崩溃或长时间失去响应从而导致死锁。

(2) Redisson 锁如何实现

  • 获取锁: 使用 Redis 的 SET 命令加上 NX(不存在时设置)和 PX(过期时间)参数来实现原子操作,从而确保只有一个客户端能够成功获得锁。
  • 释放锁: Redisson 使用 Lua 脚本来确保释放锁操作的原子性,即只有持有锁的客户端才能释放锁。
  • 自动续期: Redisson 提供了 Watchdog(看门狗)机制,一旦锁被某个客户端获取,Redisson 会启动一个后台线程,定期延长锁的过期时间,避免锁因为超时而被自动释放。

(3) 过期时间的作用及默认值

过期时间的作用是防止在锁持有者发生意外崩溃或长时间失去响应时,锁一直存在而导致其他客户端无法获得锁。过期时间确保了锁最终会在一段时间后自动释放,从而避免死锁。

Redisson 默认的锁过期时间是 30 秒。这意味着如果没有特殊配置,Redisson 锁在持有之后,如果不进行操作,30秒后会自动释放。

(4) 自动续期机制

Redisson 的自动续期机制依靠一个叫做 Watchdog(看门狗)的后台线程来实现。当一个客户端成功获取到锁时,一个后台的 Watchdog 线程会启动,默认每隔10秒执行一次续期操作,将锁的过期时间延长一定周期,以此确保持有锁的客户端在执行长时间任务时不会因为锁的过期而失去锁。

#快手##面经##面试##软件开发2024笔面经##我的求职思考#
全部评论
1 回复 分享
发布于 2024-07-31 15:33 广东
大佬的帖子都是高质量
点赞 回复 分享
发布于 2024-09-28 16:48 浙江
这是实习吗还是秋招或者社招
点赞 回复 分享
发布于 2024-08-10 09:29 澳大利亚
我们要求不高的
点赞 回复 分享
发布于 2024-08-02 16:13 上海
真是后生越来越厉害
点赞 回复 分享
发布于 2024-08-02 16:13 上海
又是感叹大佬的一天
点赞 回复 分享
发布于 2024-08-01 23:36 黑龙江
请问大佬投的快手的什么岗位?
点赞 回复 分享
发布于 2024-07-31 15:03 陕西

相关推荐

04-22 23:15
中南大学 Java
时间:4.21公司地点:北京时长:52min做了一些简化,提取了更有借鉴价值的部分1. 部门介绍2. 自我介绍3. 这两个项目你觉得哪个项目复杂度高一些,可以多聊一会4. 你这个项目主要是想解决什么样的问题呢5. 你刚才说这些方法的话,应该说也是社区内或者说比较常见的一些处理方式了,对吧?我都或多或少都能get到,但是我有一个问题,就是**你做这件事情之前,就是每一个技术的应用之前,你有没有去验证这个技术确实提升了准确率呢**6. 我们的这些处理方式是否真正的真的提升了它的准确率。就是我们只是堆砌技术,还是说我们确确实实是提升了这件事情?7. 你这一知识库当时怎么选的?你做的知识库是什么类型的知识库?8. 那你这知识库里面涉及了哪些方面的内容?比如说文学类的,还是什么科技类的?是什么航天类的等等?有没有就说具体一些?9. 那你这个博客内容写的多吗?10. 那如果14篇文章的话,而且你这14篇文章看起来所涉及的范围是比较发散的,那么在这种情况下,其实这个rag的检索本身就不容易出现,刚才说的那个检索有问题的情况,这可能本身就不是个问题。11. 在我们去真正去做一件事情这的处理的时候,其实我们还是应该先去有一个度量的标准,不然我们优化可能是负优化,我们都不知道对吧?就是说我现在要做 rag 检索。我要去先做一个度量的方式,然后去验证它的准确率,你应该怎么做?12. 你怎么判断问题回答是准确的13.那么我怎么看到线上的这些回答的准确率呢?14. 有必要搞多级缓存吗15. 好,那首先就多级缓存来说,你觉得,它有什么弊端,还有它有什么优势?这个讲一下。16. 我有一个问题,首先其实我们一般认为 redis 它的那个吞吐是非常高的,而且如果说我们比如说数量很大,Redis 它也是支持那个多节点对吧,比如说…… 不管是哪种方案吧,Redis 也可以支持多节点的这种部署,所以在这种情况下的话,我们认为 redis 从网络压力这一块是没有太大问题的。那么在你看来,有了 redis 的话,我们还要去引入本地缓存的主要目的是什么?因为刚才你说的只是为了减少网络开销。 但是现在我们实际的生产环境中 redis 的是网络开销 其实是没什么太大的问题的。你应该明白我的意思,就是 redis 网络开销不是它的核心问题,就是我为什么非要引入本地缓存17. 我看后面你还自己写过两个 SKILL 对不对?能具体展展开一个就是你可能平时,有没有平时用的比较多的,我想知道不是那种为了写而写的那种,就真正能解释你生活中问题的那种 SKILL18. 你最近面试多吗?19. 那八九场的话,就是你觉得你做的自己就是面试,就是相当于面试自己的这种 Skill 和你真正去面试中拿到的面试题,它相似度高吗?>我是我当时了解到,主要是主要是因为网络开销的问题,进一步提升响应速度20. 说实话 redis 并不存在很大量的网络开销问题  对不对?21. 我看后面你还自己写过两个 SKILL 对不对?能具体展展开一个就是你可能平时,有没有平时用的比较多的,我想知道不是那种为了写而写的那种,就真正能解释你生活中问题的那种 SKILL22. 你最近面试多吗?23. 那八九场的话,就是你觉得你做的自己就是面试,就是相当于面试自己的这种Skill和你真正去面试中拿到的面试题,它相似度高吗24. OK, 那你觉得你这个 SKILL 有没有帮你解决到一些实际面试中的问题,有没有确实命中的一些面试中的一些真正的面试题25. 对你来说,现在比如经验完经历完这场面试之后,你觉得你的 SKILL 应该如何提升呢?26. 你理解什么叫 CAS?27. 那它和悲观锁有什么不同?那首先第一个问题就是纯靠CAS就能解释就能实现这个乐观锁吗?28. 解释一下volatile的这个关键字的目的和作用29. 既然我们提到了CAS操作就一定能保证。并发更新的安全性了。那么我们为什么还要用 volatile 去修饰这个变量呢?这不多此一举吗?30. 好,那继续问 CAS 里面会有什么问题?就它会有什么其他的什么问题呢?31. 你了解 CAS 的 ABA 问题吗?32. 讲一下怎么解决就可以了33. 那现在回到这儿来说就是有乐观锁和悲观锁两种锁,对不对。那么,我什么时候要选择乐观锁?什么时候要选择悲观锁?你看,我们知道 JDK 里面 synchronized 的关键字是悲观锁,对吧?而 ReentrantLock 是个就是这种我们一般认为是 CAS+volatile 这种乐观锁的方式那么这两种方式的话,你觉得我们在应用中。什么情况下会采用乐观锁?什么时候要采用悲观锁?34. 为什么?35. 这个我知道好,那现在问一个问题 就是说,既然高并发情况下用悲观锁就很好,那我无脑用悲观锁不就完了吗?就是既然说。乐观锁有就是说并发高了,它就不行,自选浪费 CPU,对吧?那我无脑用悲观锁,不就 OK 了吗?不挺好的吗?36.那还有一个问题,就是我们刚才说的这些并发的处理的方式。都是基于一个理念叫共享内存,对吧,相当于都是无论是悲观锁还是乐观锁,我们都相当于是要在对象上加锁,然后限制一些线程的进入和退出,对不对。 那么有没有别的方式照样可以实现并发更新的?并发更新的这样的一个方式,就除了共享内存方式,还有没有别的。比如说或者说我这么说吧,就全世界上处理同一个数据的多线程更新的这个问题,只有乐观锁和悲观锁两种方式吗?是非阻塞不能处理吗?因为不管是哪个锁,其实都会进入到一个阻塞的状态,对吧?必须是通过阻塞的方式才能搞实现多线程对同一变量的更新吗?37. 手撕环节:[电话号码的字母组合](*******************************************************************)48. 反问环节
查看30道真题和解析
点赞 评论 收藏
分享
评论
21
165
分享

创作者周榜

更多
牛客网
牛客网在线编程
牛客网题解
牛客企业服务