07-03 15:13 湖南信息学院 Java 发布于湖南

关注

Redis分布式锁演进过程详解

分布式锁的基本需求

核心要求

互斥性: 任意时刻只有一个客户端能持有锁
安全性: 只有持有锁的客户端才能释放锁
活性: 不会发生死锁，最终一定能获取到锁
容错性: 部分节点宕机后，锁服务依然可用

第一阶段：SETNX的简单实现

实现方式

SETNX lock_key "client_id"

代码示例

public boolean tryLock(String lockKey, String clientId) {
    // 尝试设置锁
    String result = jedis.set(lockKey, clientId, "NX");
    return "OK".equals(result);
}

public void unlock(String lockKey, String clientId) {
    // 简单删除锁
    jedis.del(lockKey);
}

存在的问题

1. 死锁问题

场景：客户端获取锁后宕机，锁永远不会被释放
问题：其他客户端永远无法获取锁
影响：系统完全阻塞

2. 误删锁问题

// 客户端A获取锁
SETNX lock_key "client_A"

// 客户端A业务执行时间过长
// 客户端B在客户端A还在执行时删除了锁
DEL lock_key

// 客户端C获取到锁，与客户端A同时执行
SETNX lock_key "client_C"

第二阶段：加入过期时间

实现方式

SETNX lock_key "client_id"
EXPIRE lock_key 30

代码示例

public boolean tryLock(String lockKey, String clientId, int expireSeconds) {
    // 设置锁
    String result = jedis.set(lockKey, clientId, "NX");
    if ("OK".equals(result)) {
        // 设置过期时间
        jedis.expire(lockKey, expireSeconds);
        return true;
    }
    return false;
}

存在的问题

1. 非原子性操作

时序问题：
1. SETNX 成功
2. 客户端宕机（EXPIRE未执行）
3. 锁永远不会过期
结果：死锁问题依然存在

2. 过期时间设置困难

问题：
- 设置太短：业务未完成锁就过期
- 设置太长：异常情况下锁释放慢
- 业务执行时间不确定

第三阶段：原子性操作

实现方式

SET lock_key "client_id" NX EX 30

代码示例

public boolean tryLock(String lockKey, String clientId, int expireSeconds) {
    // 原子性设置锁和过期时间
    String result = jedis.set(lockKey, clientId, "NX", "EX", expireSeconds);
    return "OK".equals(result);
}

public void unlock(String lockKey, String clientId) {
    // 检查是否是自己的锁
    String value = jedis.get(lockKey);
    if (clientId.equals(value)) {
        jedis.del(lockKey);
    }
}

存在的问题

1. 锁误删问题

// 时序问题
String value = jedis.get(lockKey);        // 1. 获取锁值
if (clientId.equals(value)) {             // 2. 判断是自己的锁
    // 此时锁可能已经过期，被其他客户端获取
    jedis.del(lockKey);                   // 3. 删除锁（可能删除了别人的锁）
}

2. 锁过期问题

场景：业务执行时间 > 锁过期时间
问题：锁在业务执行过程中过期，其他客户端获取到锁
结果：多个客户端同时执行临界区代码

第四阶段：Lua脚本保证原子性

释放锁的Lua脚本

-- 释放锁的Lua脚本
if redis.call("get", KEYS[1]) == ARGV[1] then
    return redis.call("del", KEYS[1])
else
    return 0
end

代码示例

public class DistributedLock {
    private static final String UNLOCK_SCRIPT = 
        "if redis.call('get', KEYS[1]) == ARGV[1] then " +
        "    return redis.call('del', KEYS[1]) " +
        "else " +
        "    return 0 " +
        "end";
    
    public boolean tryLock(String lockKey, String clientId, int expireSeconds) {
        String result = jedis.set(lockKey, clientId, "NX", "EX", expireSeconds);
        return "OK".equals(result);
    }
    
    public boolean unlock(String lockKey, String clientId) {
        Object result = jedis.eval(UNLOCK_SCRIPT, 
                                  Collections.singletonList(lockKey), 
                                  Collections.singletonList(clientId));
        return "1".equals(result.toString());
    }
}

解决的问题

✅ 原子性释放锁
✅ 避免误删其他客户端的锁

仍存在的问题

1. 锁续期问题

场景：业务执行时间不确定
问题：
- 锁过期时间设置困难
- 业务执行中锁过期导致并发问题
- 无法动态调整锁的持有时间

第五阶段：看门狗机制

Redisson的看门狗实现原理

1. 自动续期机制

// Redisson内部实现原理
public class RedissonLock {
    private void scheduleExpirationRenewal(long threadId) {
        ExpirationEntry entry = new ExpirationEntry();
        entry.addThreadId(threadId);
        
        // 每10秒续期一次（默认30秒过期时间的1/3）
        Timeout task = commandExecutor.getConnectionManager()
            .newTimeout(new TimerTask() {
                @Override
                public void run(Timeout timeout) {
                    // 续期Lua脚本
                    renewExpiration();
                }
            }, internalLockLeaseTime / 3, TimeUnit.MILLISECONDS);
    }
}

2. 续期Lua脚本

-- 续期脚本
if redis.call('hexists', KEYS[1], ARGV[2]) == 1 then 
    return redis.call('pexpire', KEYS[1], ARGV[1])
else 
    return 0
end

看门狗机制特点

优势：
✅ 自动续期，避免业务执行中锁过期
✅ 客户端宕机时，看门狗停止，锁自然过期
✅ 无需预估业务执行时间

工作原理：
1. 获取锁时启动看门狗
2. 定时检查锁是否还被当前线程持有
3. 如果持有，则续期锁的过期时间
4. 释放锁或客户端宕机时，看门狗停止

代码示例

// Redisson使用示例
public void businessLogic() {
    RLock lock = redissonClient.getLock("myLock");
    try {
        // 获取锁，启动看门狗
        boolean acquired = lock.tryLock(3, TimeUnit.SECONDS);
        if (acquired) {
            // 执行业务逻辑，无需担心锁过期
            doBusinessLogic();
        }
    } finally {
        // 释放锁，停止看门狗
        if (lock.isHeldByCurrentThread()) {
            lock.unlock();
        }
    }
}

第六阶段：可重入锁

可重入锁的需求

public void methodA() {
    lock.lock();
    try {
        methodB(); // 需要再次获取同一把锁
    } finally {
        lock.unlock();
    }
}

public void methodB() {
    lock.lock(); // 同一线程再次获取锁
    try {
        // 业务逻辑
    } finally {
        lock.unlock();
    }
}

Redisson可重入锁实现

1. 数据结构

# 使用Hash结构存储锁信息
HSET lock_key thread_id count
# 例如：
HSET myLock "thread_123" 2  # 线程123持有锁，重入次数为2

2. 获取锁的Lua脚本

-- 可重入锁获取脚本
if (redis.call('exists', KEYS[1]) == 0) then 
    redis.call('hset', KEYS[1], ARGV[2], 1)
    redis.call('pexpire', KEYS[1], ARGV[1])
    return nil
end

if (redis.call('hexists', KEYS[1], ARGV[2]) == 1) then 
    redis.call('hincrby', KEYS[1], ARGV[2], 1)
    redis.call('pexpire', KEYS[1], ARGV[1])
    return nil
end

return redis.call('pttl', KEYS[1])

3. 释放锁的Lua脚本

-- 可重入锁释放脚本
if (redis.call('hexists', KEYS[1], ARGV[3]) == 0) then 
    return nil
end

local counter = redis.call('hincrby', KEYS[1], ARGV[3], -1)
if (counter > 0) then 
    redis.call('pexpire', KEYS[1], ARGV[2])
    return 0
else 
    redis.call('del', KEYS[1])
    return 1
end

第七阶段：红锁算法

单点故障问题

问题：Redis主从架构下的锁丢失
场景：
1. 客户端A在Master上获取锁
2. Master宕机，锁信息未同步到Slave
3. Slave提升为Master
4. 客户端B在新Master上获取到同一把锁
结果：两个客户端同时持有锁

红锁算法原理

1. 多实例部署

部署N个独立的Redis实例（通常N=5）
每个实例都是独立的，不存在主从关系

2. 获取锁流程

1. 获取当前时间戳 start_time
2. 依次向N个实例请求锁，设置超时时间
3. 计算获取锁的总耗时
4. 判断是否获取锁成功：
   - 获取锁的实例数 > N/2
   - 总耗时 < 锁的有效时间
5. 如果成功，锁的实际有效时间 = 原有效时间 - 总耗时
6. 如果失败，向所有实例释放锁

3. 代码示例

public class RedLock {
    private List<RedisClient> redisClients;
    
    public boolean tryLock(String lockKey, String clientId, long expireTime) {
        long startTime = System.currentTimeMillis();
        int successCount = 0;
        
        // 向所有实例请求锁
        for (RedisClient client : redisClients) {
            try {
                boolean success = client.set(lockKey, clientId, "NX", "PX", expireTime);
                if (success) {
                    successCount++;
                }
            } catch (Exception e) {
                // 忽略异常，继续下一个实例
            }
        }
        
        long costTime = System.currentTimeMillis() - startTime;
        
        // 判断是否获取锁成功
        if (successCount >= (redisClients.size() / 2 + 1) && 
            costTime < expireTime) {
            return true;
        } else {
            // 释放已获取的锁
            unlock(lockKey, clientId);
            return false;
        }
    }
}

常见问题总结

1. 死锁问题

原因：锁没有过期时间或客户端宕机
解决：设置合理的过期时间 + 看门狗机制

2. 锁误删问题

原因：删除锁时没有验证锁的所有者
解决：使用Lua脚本原子性验证和删除

3. 锁过期问题

原因：业务执行时间超过锁的过期时间
解决：看门狗机制自动续期

4. 可重入问题

原因：同一线程无法多次获取同一把锁
解决：使用Hash结构记录重入次数

5. 主从切换问题

原因：主从异步复制导致锁丢失
解决：红锁算法使用多个独立实例

6. 性能问题

原因：频繁的网络交互和Lua脚本执行
优化：
- 合理设置锁粒度
- 使用连接池
- 批量操作
- 监控锁的获取成功率和耗时

7. 时钟偏移问题

原因：不同服务器时钟不同步
影响：锁的过期时间计算不准确
解决：使用NTP同步时钟，或使用相对时间

最佳实践建议

1. 锁设计原则

锁粒度要合适，避免粗粒度锁
锁的key要有业务含义
设置合理的超时时间

2. 异常处理

必须在finally块中释放锁
处理获取锁超时的情况
记录详细的日志便于排查

3. 监控告警

监控锁的获取成功率
监控锁的持有时间
监控Redis的性能指标

4. 降级策略

Redis不可用时的降级方案
锁获取失败时的业务处理
本地锁作为备选方案

#分布式锁##redis#

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

07-02 14:54

字节暑期实习OC

最近看到了好多OC的牛友，接好运没白接，轮到我了！创作部门的前端开发偏算法的实习生投递日期是6.09日一面是6,17日主要问的是motivation到实现细节，大概60min二面是6.23日主要问：1、Flow matching 是怎么做的 2、DDPM 的加噪方式 3、DDPM 和 Flow Matching 区别 为什么大家转Flow Matching三面HR面6.27日基本就是了解情况，HR说没问题就是下午OC6,27下午OC6.30发入职邮件7.7入职

查看3道真题和解析

点赞评论收藏

06-20 19:25

已编辑

滴滴_Java开发(实习员工)

2025-5-12 腾讯云智一面

自我介绍 实习分布式事务分表的一个量级你具体分了几个表你解决接口超时时，上异步和线程池是怎么评估这个性能的影响了，你做了哪些测试和对比看串行代码，分析是否能上异步，分析一下配置的公共线程池是用在哪，在哪一些业务，进行优化30s->3s有没有试过其他方案，公共字段用范形存储，非公共字段用Json存储解决分表问题CountDownLatch在同步机制场景下的优势，分析异步不暂停的情况，举例子CountDownLatch的方法是如何控制异步的你是怎么整合Spring事务的手动提交和异步编程的一个配合的，说一遍怎么实现，全部提交全部回滚保证原子性CountDonwLatch的原理和应用场景，AQS->State->自旋锁消耗CPU资源->CLH队列->公平锁非公平锁CLH队列Node节点的4种状态表示：1. CanCelled取消2. Singal 等等要去唤醒下一个节点3. Condition 等待对方唤醒4. propagate 唤醒后续一个or多个节点分布式锁，setnx->锁误删，锁续期，不可重入，非公平锁->ReenTranLock->看门狗，可重入，可设置超时时间，可实现公平锁和非公平锁，可防止锁误删，底层是Redis+Lua脚本你在数据推送的推拉逻辑结合的时候你遇到了哪一些难点你说的Nacos放行Controller是什么东西？面试官说他们是用自定义注解直接注册到Nacos上的当数据量大的时候，会出现延迟以及一致性问题，这个你们是怎么去解决的TraceId追踪，网关重试防止网络波动，网关默认超时时间防止阻塞Redis是怎么解决高并发下一致性的问题的，JWT维护登录状态实现鉴权Redis的特性->内存数据库，IO多路复用->多线程网络IO,单线程执行命令（忘记说自带过期时间了）你是怎么评估Redis的性能和稳定性性能应该是运维工具普罗米修斯监控，稳定性的话就是主从集群，哨兵集群，分片集群哨兵集群说一下Raft选举算法，三种角色，投票选举，Sentinel主观下线和客观下线投票MQ保证可靠性的场景说一下RabbitMq的Return，Confirm，ACK机制有没有了解RaabitMq新版本的特性，你用的是哪个版本的过去的项目有咩有可以优化的地方，有没有印象深刻的案例可以举一下例子Redis的动态调配线程池参数->转换到Nacos等注册中心来管理对于新技术和新技术栈，你是如何学习和掌握的，视频，文档，项目中的敏感词过滤框架RabbitMQ->Kafka，举一反三，学习底层思想K8S了解吗未来的职业规划是什么算法并查集找环for循环暴力查找字符串反问面试官对我有什么建议吗？面试过程中有什么问题？要吃透知识点，从技术栈到选型来提升自己，这对技术人员是一个很大的提升至今无后续，全答出来都能进池子，真不如最美xx用黑马项目直接进云智吧

点赞评论收藏

06-11 18:01

苏州科技大学产品经理

🐬厂（携程）实习三个月教会我的事

依稀记得刚开始实习时眼里只有清澈的愚蠢，唯唯诺诺的样子现在变成了文档写的贼6，大胆发言，浑身冲天的班味说说携程带给我的进步～学会厚脸皮提问：不会就问，虽然可能问了也不会～但前辈们其实很愿意教！犯错不可怕：可怕的是因为怕犯错而不做，反正错就错了，人活着就是会犯错的～工作和生活分不开：当你选择了大厂，那就意味着你要和纯粹的生活saygoodbye了，因为真的分不开😂学会降低预期：不要试图想事事做得完美，先完成再优化。

投递携程等公司8个岗位

点赞评论收藏

06-20 21:31

门头沟学院 Java

懂车帝一面

没有录音，就写一些还记着的题目，抓着一个点会一直往深处问你1.你在实习中有哪些收获？解决了什么令你印象深刻的问题？2.你的这个方案是如何得出来的？sql优化的过程？3.数据库中的二十多个索引如何压测的？是一次性压测，还是随机选择压测？4.Elasticsearch的架构是怎样的？简单讲一下5.Elasticsearch的倒排索引？为什么Elasticsearch快？6.Elasticsearch的Segent？Refresh？7.Elasticsearch的Flush？Merge？8.你们的接口最大达到了2000 qbs是吧？可不可能出现流量突增的情况？这时候该怎么处理？9.除了令牌桶和漏桶算法，还有没有什么其他的？抛开这两个算法10.两个窗口固定了边界值，怎么解决呢？手撕限时20min倒计时：滑动窗口限流器反问

查看10道真题和解析

点赞评论收藏

06-10 09:36

中国地质大学 Java

字节还是那么喜欢考算法

今天分享的是训练营的朋友在字节跳动的面经，整个面试过程差不多一个小时，一半时间拷打八股，一半时间拷打算法，字节还是那么喜欢考算法。面经详解1 讲讲项目难易点常考的问题，对于自己的项目可以提前准备好话术2 kafka处理消息丢失和消息重复在分布式消息系统如Apache Kafka中，消息丢失和消息重复是两个常见的问题。为了解决这些问题，可以采取一系列的措施和技术手段。以下是一些处理Kafka消息丢失和消息重复的方法：消息丢失确认机制：确保消费者在成功处理完消息后才提交偏移量（offset），这可以通过设置enable.auto.commit=false并手动管理偏移量来实现。持久化配置：设置适当...

点赞评论收藏

招聘动态

快手

快Star-X特别技术人才计划启动

现代汽车前瞻技术研发中心

京东TET

全站热榜

创作者周榜

正在热议

# 现代汽车前瞻技术研发急速编程挑战赛 #

# 机械人，你的秋招第一份简历被谁挂了 #

Redis分布式锁演进过程详解

目录

分布式锁的基本需求

核心要求

第一阶段：SETNX的简单实现

实现方式

代码示例

存在的问题

1. 死锁问题

2. 误删锁问题

第二阶段：加入过期时间

实现方式

代码示例

存在的问题

1. 非原子性操作

2. 过期时间设置困难

第三阶段：原子性操作

实现方式

代码示例

存在的问题

1. 锁误删问题

2. 锁过期问题

第四阶段：Lua脚本保证原子性

释放锁的Lua脚本

代码示例

解决的问题

仍存在的问题

1. 锁续期问题

第五阶段：看门狗机制

Redisson的看门狗实现原理

1. 自动续期机制

2. 续期Lua脚本

看门狗机制特点

代码示例

第六阶段：可重入锁

可重入锁的需求

Redisson可重入锁实现

1. 数据结构

2. 获取锁的Lua脚本

3. 释放锁的Lua脚本

第七阶段：红锁算法

单点故障问题

红锁算法原理

1. 多实例部署

2. 获取锁流程

3. 代码示例

常见问题总结

1. 死锁问题

2. 锁误删问题

3. 锁过期问题

4. 可重入问题

5. 主从切换问题

6. 性能问题

7. 时钟偏移问题

最佳实践建议

1. 锁设计原则

2. 异常处理

3. 监控告警

4. 降级策略

全站热榜

创作者周榜