Java三段

2024-07-25 17:10 西安电子科技大学 Java 发布于陕西

关注

面试官：聊聊你对分库分表的理解？

在 MySQL 集群架构中有两种主流的集群实现，一种是读写分离，而另外一种则是数据分片。所谓的数据分片其实就是今天要聊的分库分表技术。

分库分表技术不但是日常工作中用于解决数据库中的数据量会急剧增长，解决单库单表性能瓶颈的一种方案，更是面试中的高频知识点。

在阿里巴巴的《Java 开发手册》中规定：当单表的数据超过 500 万，或单表的大小超过 2GB 时，就要考虑分库分表了。那么什么是分库分表呢？

1.分库分表

首先来说，“分库分表”不是一个技术，而是两个技术实现，它分为：

分库
1. 垂直分库
2. 水平分库
分表
1. 垂直分表
2. 水平分表

1.1 垂直分库

垂直分库是按照业务将不同的表拆分到不同的数据库中。例如，在一个电商数据库中的用户表和订单表分别存放到不同的数据库中，如下图所示：

alt

1.2 水平分库

水平分库是将数据按照一定的规则（如用户 ID 取模、哈希等）分布到不同的数据库中。比如，根据用户 ID 对 10 取模，将用户数据分布到 10 个不同的数据库中，每个数据库都保存着完整的数据表结构，如下图所示：

alt

1.3 垂直分表

垂直分表是将一张表按照列的相关性拆分成多张表。例如，将一个包含大量字段的用户表，拆分为用户基本信息表和用户扩展信息表，如下图所示：

alt

1.4 水平分表

水平分表是将一张表的数据按照行进行拆分。例如按照用户 ID 的范围或者哈希值将数据拆分到不同的表中。

alt

如果搞不清楚什么是垂直分表和什么是水平分表？可以参考一下这幅图思考一下：

alt

2.技术实现

分库分表的主流实现技术有以下两种：

MyCat
Apache Sharding Sphere

Sharding Sphere 相比于 MyCat 来说，它的优势是：

功能更多：除了读写分离和分库分表之外，还提供了数据加密、流量质量、数据迁移等功能。
社区更活跃度和生态更好：Sharding Sphere 拥有活跃的社区和丰富的文档，生态系统较为完善，有更多的用户和开发者参与。
灵活性和扩展性：Sharding Sphere 灵活性更高，扩展性也更好，它可以方便地与其他技术集成，这方便 MyCat 支持的比较有限。

3.Sharding Sphere

Sharding Sphere 最早是当当网的内部框架，后面捐献给了 Apache，目前也是分库分表的主流技术实现方案，在 Sharding Sphere 中有两种分库分表的技术实现：

Sharding Sphere JDBC：定位为轻量级 Java 框架，在 Java 的 JDBC 层提供的额外服务。它使用客户端直连数据库，以 jar 包形式提供服务，无需额外部署和依赖，可理解为增强版的 JDBC 驱动，完全兼容 JDBC 和各种 ORM 框架。

alt

Sharding Sphere Proxy：定位为透明化的数据库代理端，通过实现数据库二进制协议，对异构语言提供支持。目前提供 MySQL 和 PostgreSQL 协议，透明化数据库操作，对 DBA 更加友好。

alt

它们的区别如下：

ShardingSphere-JDBCShardingSphere-Proxy

支持数据库	任意	MySQL/PostgreSQL
连接消耗数	高	低
支持语言	仅 Java	任意
性能	损耗低	损耗略高
无中心化	是	否

课后思考

Sharding Sphere JDBC 和 Sharding Sphere Proxy 使用场景分别是啥？ShardingSphere-JDBC 具体实现步骤有哪些？说说它的实现原理？

#java#

Java面试精讲文章被收录于专栏

Java常见面试题、场景题、企业真题精讲。

全部评论

推荐最新楼层

不愿透露姓名的神秘牛友

05-18 00:05

分库分表

分库分表模式：1. 垂直分库：垂直份库指的是按照业务模块维度将原本集中在一个数据库中的多个表，拆分到多个独立的数据库中。每个数据库只负责一个或几个功能相近的业务模块，例如用户库、订单库、商品库等。本质上，垂直拆库是将一个“通用大库”拆解成“多个专业小库”，使每个库专注于一类业务领域。2. 垂直分表垂直分表指的是将一个表中字段较多、关注点不同的列按功能拆分成多个表，通常以主键（如用户ID）为关联字段，拆分后的表仍具有一对一或一对多的关系。举例：将原 user 表拆成 user_base（基本信息）和 user_detail（扩展信息）两个表。3. 水平分库水平分库是指：将表的数据按某种规则分散到...

匿名牛油：如果有写的不对或者需要补充的地方，欢迎各位大佬指正！

运营每日一题牛客创作赏金赛

点赞评论收藏

05-25 20:08

电子科技大学 Java

分库分表的中间件MyCat需要学吗

看的黑马的MySQL，mycat那里真的听天书了，不知道是不是面试重点，做项目用不用到。还是直接跳过呢

点赞评论收藏

05-13 09:57

北京邮电大学 Java

美团面试的一些项目问题

问题1：为什么会使用分库分表，到达了什么样的数据级别才会去加设计，是否对数据量有一个统计我的理解：看星哥之前写过 单表行数超 500 万行或者单表容量超过 2GB，推荐分库分表，但是面试的过程中怕被问自己写的项目会有这么大的数据量吗不要这么硬背，具体情况具体分析，有的表字段少，经常是条件等值查询，这样加个索引，一个亿也不用分表，有的字段多，还是范围查询，可能5000万就得分表，面试官问你你说是自己在学习分库分表应用到项目中，自己造了几千万的数据量问题2：基因法需要分表的一个数量和确定的一个东西（我的理解是分表的依据，例如大麦中是订单编号和用户id），但是正常的生产环境中是可能动态改变的，比如说需要动态扩容的话，怎么解决呢（例如当前有4个分表，但是现在需要扩充到8个分表），是使用双写吗？这个在扩容前就要考虑好能维持多少年内不需要再扩容。转转架构师在分库分表前，通过之前记录的数据增长量，做了256张表，能在7年内不需要再扩容，如果需要扩容的话，可以使用双写，新扩容表写的过程中，用新的分库分表算法问题3：如果在防止超卖的过程中，Redis不可用了，怎么解决我的理解：使用Redis集群和主从复制吗？因为Redis宕机的话数据库的数据也不能保证是最新的版本，所以得尽量保证Redis不宕机？肯定要使用redis集群模式，但可能会有主从延迟，导致从节点数据不是最新的，但关系不大。可以在用户生成订单后，修改数据库的座位和库存，然后用户支付后，再改数据库的座位和库存，每一步都做好验证。这样从节点的数据问题会降到最低。问题4：如果在当前的幂等验证逻辑中，有一个消息所对应的幂等标识符是不存在的，按照现有的逻辑是可以执行的，但是幂等验证之后的业务系统异常了，这个时候应该怎么处理呢（即通过了幂等的验证，但是后面的服务down掉了，比如说下游抛了一个异常出来）【没太明白应该回答什么，是指需要将幂等标识符重新进行设置吗】异常了就异常了呗，把这个请求的标识从redis中删除了，就像分布式锁时，业务异常也要执行解锁一样，让下一个请求进来正常执行，然后设置好标识位问题5：本地缓存为什么使用Caffine呢，为啥不用Guava因为caffine的性能要远高于Guava，没有其他复杂原因我的理解：查了下Caffine就是Guava改进而来的，可以这么说吗- Caffine在读写操作方面的性能更高，是基于异步的操作，将淘汰过期操作与读写进行分离- Caffine采用了一种结合 LRU、LFU的算法W-TinyLFU+，具有高命中率，低内存占用的特点

查看5道真题和解析

点赞评论收藏

05-13 16:14

厦门大学 Java

5.12得物java暑期一面面经

上来先简单自我介绍 然后问了一下项目中你认为有哪些困难，这里自己说了一些后面就问了一下你在学习过程中对哪一部分最熟悉 （说的数据库那一方面）然后就开始拷打一点八股redis的跳表怎么实现 为什么不用b+树数据库的幻读问题有没有了解 怎么解决幻读线程池怎么保证核心线程一直存活（这里不怎么会 面试官让多想想）给你一个秒杀场景 有个优惠券 秒杀的时候优惠券下架了怎么保证 用户不会读到redis里面的脏数据（答的延迟双删）问了一下你了解数据库的分库分表嘛 什么时候回用到分库分表 使用了分库分表会遇到什么问题（这里答的不太好 毕竟没用过）还有你了解redis的集群嘛 他是怎么来确定哪个key要分配到哪个节点的（这里说通过槽的方式） 然后追问 槽这种有什么优势 和普通的哈希表比起来（这里就有点懵了感觉不就是一个哈希数组嘛 没理解什么意思）还问spring的transitional注解怎么实现的 （答使用的aop 然后try catch捕获异常之后回滚，他问我有没有更简单的方法 这里也不太会了😭）差不多就这些 其他有点忘了可能 总共面了30分钟多一点 感觉答的不太理想 希望能收到offer

查看12道真题和解析

点赞评论收藏

05-23 12:22

已编辑

重庆邮电大学 golang

云智西安

5.9一面，当晚显示复试状态，5.13显示暂不匹配，当天下午再次约面5.15一面 常规八股加项目加手撕优先级任务调度 一个小时5.19约二面5.20 晚上二面 项目拷打，场景题，写伪代码加算法 一个小时5.21 显示HR面5.22 约HR面 下午五点半 但是只有15分钟五分钟HR面，这也太迅速了，说注意邮箱，快的话这周，慢的话下周，许愿OC反问的学习建议“你才本科吧，我觉得还是不错的，知识点也广泛，常用技术栈也熟练，写代码也写的快（应该是指手撕），学习方面建议可以多看看源码（因为问我看没看过context源码和linux源码并没看过）”反问几面 “好像你们校招三面，两轮技术面，后面注意邮箱和短信吧”显示HR面,稳吗?会不会突然又变成筛选中很迅速,速通了,HR面第二天中午就发了OC  

牛客445205706号：别看了，评论区的都能这个状态

查看图片

如何判断面试是否凉了

点赞评论收藏

招聘动态

26届投递链接合集

华泰证券Fintech星战营

全站热榜

华为开奖进度👉

热聊中

创作者周榜

正在热议