昨天 10:16 算法工程师发布于湖北

关注

HashMap三连问：数组布局、链表碰撞、树化升级，一次性讲透！

在Java面试中，HashMap几乎是“逢面必问”的经典题目。很多朋友一听到HashMap就紧张，担心被问到扩容、哈希冲突、红黑树这些概念。其实不用慌，哪怕你之前只是背过答案，只要理清三条主线问题，就能从容应对。

Q1：HashMap底层为什么是“数组+链表”？数组用来做什么？

HashMap的底层结构，可以想象成一个“带有编号的储物柜阵列”。这个阵列就是数组，每个位置叫做一个“桶”（bucket）。

当你往HashMap里存入一个键值对时，会先通过键的哈希值计算出一个数组下标，然后把这个键值对放到对应下标的桶里。

那问题来了：不同的键有可能算出相同的数组下标，这就叫“哈希碰撞”。比如两个键的哈希值不同，但取模后都落到了第5号桶，该怎么办？

答案就是让每个桶里面不只是一个对象，而是一个链表。新来的键值对如果落在同一个桶，就追加到链表尾部（Java 8之前是头插法，后来改为尾插法，避免链表成环）。

所以结论很直观：

数组用来快速定位到具体的桶，时间复杂度O(1)。

链表用来解决同一个桶里的多个键值对，通过遍历链表逐个比较equals()找到正确的键。

用生活例子来理解：

数组好比一排信箱，每个信箱号就是哈希值的映射结果。两个不同的人（键）如果被分配到了同一个信箱号，就把他们的信件叠放在这个信箱里（链表）。查找时先根据信箱号定位，再在叠放的信件中逐一核对收件人名字。

Q2：链表什么时候会升级成红黑树？为什么要升级？

如果某个桶里的链表越来越长，查找一个元素的时间会变成O(n)，性能就会下降。为了改善这种情况，Java 8引入了一个升级机制：当链表长度达到8，并且数组总长度达到64时，链表会转换为红黑树。

红黑树是一种自平衡的二叉查找树，查找、插入、删除的平均时间复杂度是O(log n)。相比链表的O(n)，在数据量大的时候优势非常明显。

那为什么不是一上来就用红黑树？ www.687game.com.cn

因为树节点占用内存大约是链表节点的两倍，对于元素很少的情况，链表更节省空间。所以HashMap设定了一个阈值：

链表长度小于等于6时，保持链表或者从树转回链表（树退化为链表）。

链表长度达到8且数组长度≥64时，转为红黑树。

如果链表长度达到8但数组长度小于64，不会转树，而是先对数组进行扩容，分散数据。

具体数字8和6之间有一个差值，是为了避免频繁转换造成性能抖动（就像空调不会在临界点反复开关）。

为什么要用红黑树而不是普通二叉查找树？

因为普通二叉查找树在最坏情况下会退化成一个长链表（比如插入的键刚好都是递增顺序），而红黑树通过颜色标记和旋转操作保证树大致平衡，避免性能崩塌。

Q3：HashMap扩容时，元素怎么重新分配？会不会特别慢？

HashMap的数组长度是有限的，当存放的元素越来越多，哈希碰撞的概率就会上升，所以需要动态扩容。

扩容触发条件：

当HashMap中存放的键值对数量超过了“数组长度 × 负载因子（默认0.75）”时，数组长度会翻倍（通常是变为原来的2倍）。

默认负载因子0.75是一个经验平衡值：太小会频繁扩容浪费空间，太大会增加哈希碰撞降低查询效率。

扩容的核心过程：

创建一个长度为原来2倍的新数组。

遍历旧数组的每个桶，把桶里的每个元素重新计算在新数组中的下标，并移动到新数组里。

对于链表节点，会拆分成两个小链表：一个留在原来的索引位置，另一个放到“原索引+旧数组长度”的位置。这个设计很巧妙，不需要为每个节点重新计算哈希值，只需要看哈希值新增的那一位是0还是1。

对于红黑树节点，同样会做拆分，如果拆分后树的节点数小于等于6，则退化为链表。

扩容会不会慢？

会。扩容需要遍历所有元素并重新分配，这是一个O(n)的操作。但HashMap的设计目标是：让扩容的次数尽量少（通过负载因子控制），并且单次扩容的耗时在可接受范围。在实际使用时，如果能提前预估数据量，可以在构造HashMap时指定初始容量，减少扩容带来的性能损耗。

进阶思考：HashMap为什么不线程安全？

这也是面试常见追问。HashMap没有对内部操作加锁，在多线程环境下同时进行put操作可能会导致：

链表形成循环依赖（虽然Java 8修复了头插法的成环问题，但仍存在数据覆盖等并发问题）。

两个线程同时触发扩容，可能导致部分元素丢失。

一个线程正在扩容，另一个线程来查询，可能查不到数据。

如果需要在多线程环境下使用，可以考虑：

Collections.synchronizedMap(new HashMap<>())，在每个方法上加了一个同步锁。

或者直接使用ConcurrentHashMap，它的分段锁或CAS机制效率更高。

但单纯面试角度，能说清楚HashMap为什么不安全，并且知道代替方案就够了。

常见误区澄清

误区一：哈希值就是数组下标。

不对。实际步骤是：调用键的hashCode()得到哈希值，然后HashMap再对哈希值做一个高位扰动运算（让哈希值的高位也参与低位运算），最后用扰动后的结果与数组长度-1做&运算得到下标。这样可以让哈希分布更均匀，减少碰撞。

误区二：负载因子越小越好。

不是。负载因子太小意味着数组比较空就会扩容，浪费内存空间，而且扩容本身也有性能开销。0.75是经过实践检验的折中值。

误区三：红黑树总是比链表快。

不成立。对于少量元素（比如几个或十几个），链表的内存局部性好，简单遍历甚至比树结构的节点跳转更快。所以HashMap才会在节点很少时把树退化为链表。

数组负责快速定位。

链表负责处理少量碰撞 www.haomir.com.cn/yxgl/350.html

当链表长度达到8且数组长度≥64，链表转红黑树，提高查询效率。

红黑树的查找、插入、删除时间复杂度为O(log n)，链表是O(n)。

扩容时重新分配元素，尽量不影响整体性能。

结语

回过头来看，HashMap的设计其实很优雅：用数组解决定位速度，用链表解决哈希冲突，用红黑树解决极端碰撞下的性能退化。这三个结构的组合，正好对应了我们拆解出来的三个核心问题。

面试中遇到HashMap，不要慌。你只要从“数组+链表”讲起，接着说链表转红黑树的条件和原因，最后解释扩容机制和线程安全问题，基本就能覆盖80%以上的考点。剩下的细节（比如扰动函数、扩容时的位运算优化、树化与退化阈值）可以作为加分点，展示你的理解深度。

最重要的是，不要死记硬背。把HashMap想象成一个灵活变通的仓库管理员：货架多时用编号直接取（数组），货架拥堵时在格子里加一条小链子（链表），链子太长就换成带索引的格子树（红黑树）。这样理解后，无论面试官怎么追问，你都能有条理地答出来。

祝你面试顺利，HashMap三问轻松过关！

#我的求职进度条##秋招投递攻略##拿到offer之后，可以做些什么##你觉得mentor喜欢什么样的实习生##你的mentor是什么样的人？#

全部评论

推荐最新楼层

05-27 21:58

门头沟学院前端工程师

逆天面试体验

面试官披头散发刚睡醒在自己家卧室坐床上面的 全程只能看到面试官下巴以上半张脸  非要我说出实习时项目组前后端有多少人 怎么回答都不满意 只要回答的不满意就翻白眼甩脸子叹气 最后时长快到了语速飞快声音也开始有气无力 鼓鼓囊囊不知道在说啥 没错 这就是我的终面技术面 前面的业务面技术拷打都挺过来了 终面就这样面完然后秒挂 我也是没骨气 打了hr电话 说了我的面试体验并且想再申请一次面试机会 但hr也没办法 顶多帮我反馈一下但是也没啥用 hr问我既然你觉得这个公司都这样对你了你还要进吗 但是我没办法了真的 已经6月了我仍然0offer 如果你让我跪下求你给我面试 我也会毫不犹豫的

点赞评论收藏

05-26 19:27

上海大学算法工程师

redis缓存 -店铺查询

逐行超详细通俗解释我把代码拆成 5 个核心模块 来讲，你一看就懂。模块 1：先去 Redis 缓存里查店铺java运行 // 通过店铺ID获取店铺信息 String shop_key = CACHE_SHOP_KEY + id; String shopJson = stringRedisTemplate.opsForValue().get(shop_key); 意思：先查缓存，不直接查数据库（减轻数据库压力）shop_key 是缓存的 key，比如 shop:1001模块 2：缓存里有数据 → 直接返回java运行 // 如果店铺信息不为空则返回店铺信息 if (StrUtil.isNotBl...

点赞评论收藏

05-07 15:08

已编辑

长沙理工大学 Java

深圳开科唯识初级Java(1-3年)面经

2年多经验，面Java，简历筛选到约面试极快，下午5点推进简历，6点通知晚上7点面试，线上面试30分钟拉满，给了反问环节。感受：比常见的初级面试难出一个档次，问题很多很密，一个答不上来或者漏了，立马抛出下一个问题。面试压力挺大的。面试官技术栈深，喜欢追问细节，就是不确定是我撑过了30分钟还是他凑时长。真题复盘：项目类1、你做过难度最大，最有成就感的事情是什么（答了我简历写上千万级数据迁移）2、 为什么MySQL迁MongoDB？答错（MongoDB不适合说关联查询慢）3、三读一写怎么定的？压测数据：单读3600ms/单写1300ms，测了2读1写还慢，最后定3读1写4、迁移过程怎么确保不重复的？（答了游标分页规避边界遗漏，失败精准裁剪重试、断点重试、凌晨迁移）5、如果要做增量迁移，怎么处理？（只答了双写，没记住具体的做法）6、数据迁移的校验机制是什么样的，怎么验证数据没有丢失重复？(答的最大业务id和数据条数比对，因为我的断点续传机制可以保证没丢没重，当时也没出问题)7、优惠券小程序的业务流程是什么？（按照实际流程答了）8、优惠券怎么防止超领？是否有上线？（答的因为并发不大，直接数据库SQL原子更新）9、为什么要使用随机字符串做防重复？只用时间戳为什么不可以？答错（答的防重作用，时间戳作用。正确应该还说两个人同时登录可能时间戳完全一样）10、先验后调方案的落地是什么样的？（答得整个验签流程）11、这个验签是在拦截器做的吗？（应该是想问我拦截器那怎么写，但我当时做的时候是接口层弄得 ）Java基础1、基本数据类型？漏了byte2、那为什么还需要包装类型？没答好（只说了泛型必须对象，成员变量基本类型，方法参数包装类型）3、包装类和基本数据类型使用场景大概是哪些？没答好（还是和第二问说的一样的）4、 从底层说说double金额隐患？（说了精度丢失，没展开IEEE 754）6、Java中String为什么不可变（漏了类内部不提供修改方法）7、多线程实现方式。（连续几个没答对，太紧张，背了两种就卡壳被打断了）8、讲一下对死锁的理解。（说了死锁四大条件和一种解决方式）9、多线程中start和run方法的区别（说的run方法存放线程具体逻辑，start方法触发线程就绪状态，没背八股，自己推测的）10、ArrayList和LinkedList的底层在增加数据有什么不同？（前者需要扩容，中间慢，尾部快，后者中间慢头尾快）11、jdk8的新特性你了解哪些？没背八股（说的接口default和static、还有hashmap的变化，偏了但是面试官耐心听我说完了）12、自定义异常类是怎么做的？（写过也完全忘了）13、SpringBoot默认集成的Web容器？（Tomcat）14、怎么修改集成的容器？（不会）15、Redis数据库一致性的保障措施？（先更后删、延迟双删、binlog日志监听）总结：项目亮点（迁移数据+压测调优）顶住了，但Java基础和安全设计被扒了一层皮。30分钟撑下来了，但知道自己短板在哪。接下来对着错题一个一个啃。建议：java基础要背一些关于底层的东西，项目问的也不少，深挖5个问题，需要顶住。

查看13道真题和解析

点赞评论收藏

04-30 08:48

门头沟学院 Java

有时，线下小众渠道更有效

最开始跟大家一样，把牛客、BOSS直聘、智联招聘刷烂了，前前后后海投了200多份简历，结果90%已读不回，剩下10%连笔试机会都没给，整个人陷入了深深的自我怀疑，觉得自己毕业即失业。那时候我天天在出租屋里刷新招聘软件，刷到眼睛都花了，还是一点回音都没有。跟已经工作的学长吐槽，他一句话点醒了我：“线上海投本来就是大海捞针，HR一天收上千份简历，根本看不到你的。想拿面试，就得走别人不走的渠道，让你的简历被HR真真切切看到。”也是从那时候起，我放弃了纯线上海投，开始找各种线下和小众的投递渠道，前后折腾了一个月，终于拿到了3个杭州互联网公司的后端开发offer，其中还有一家是我之前海投根本过不了简历关...

除了线上，还能去哪些地方...

点赞评论收藏

昨天 14:04

电子科技大学人工智能

牛友们这是乌龙嘛

我何德何能

点赞评论收藏

招聘动态

快手

27届实习超多转正机会

27届校招宝典

网申助手插件

校招信息网申列表

全站热榜

创作者周榜

正在热议

# 你觉得mentor喜欢什么样的实习生 #