2020-06-30 16:22 已编辑华为_2012实验室_软开

关注

学一学HashMap 1.7

一、底层结构

1.7 数组加链表
1.8 数组加链表加红黑树（单向链表）

二、源码分析的一些疑问点（1.7）

发生冲突时，链表采用头插法。

头插法一定比尾插好吗？

不见得，因为你总会去遍历一次链表，看是否有这个元素，没有才需要插入。
key是允许为null的。

补充知识：二的幂次方的数，用二进制表达，所有位上，只有1个位是1。如8，就是1000.

为什么容量是2的幂次方？

n是容量，(n - 1) & hash实际上是计算出 key 在数组中索引位置。用这个与运算代替了取模运算。
(n - 1) & hash，当n为2次幂时，会满足一个公式：(n - 1) & hash = hash % n

由于取模的预算没有位运算快，因此为了性能这么设计也合理。

因此我们即使设定容量不为幂，底层也会帮助我们改成2的幂次。如我们设定为10，实际容量会是16.

key能为null吗？

key为null，会存在数组中的索引为0的位置。
HashMap对象的key、value值均可为null。但显然只能有一个Key为null。
HahTable对象的key、value值均不可为null。

且两者的的key值均不能重复，若添加key相同的键值对，后面的value会自动覆盖前面的value，但不会报错。

扩容为什么是2倍

可以和容量是2的幂次方的问题相同

1.7扩容线程不安全时会出现循环链表

如果链表中为1->2->3，那么扩容可能形成3->2->1，因为是头插法，所有顺序都颠倒了。中间某个线程不安全就会导致头尾相连。

在多线程环境下，1.7 会产生死循环、数据丢失、数据覆盖的问题，1.8 中会有数据覆盖的问题。（改成尾插也是有问题的）

负载因子0.75

当map中的所有元素个数超过数组容量的0.75倍，就会扩容。
那为什么是0.75呢，反正大了为1容易冲突，小了0.5容易浪费空间，0.75是一个折中的考虑。为什么不是0.6或者0.8，这个可以根据大量的数据插入计算出效率，0.75可能折中是最佳。

fast-fail机制

当多个线程对同一个集合进行操作的时候，某线程访问集合的过程中，该集合的内容被其他线程所改变(即其它线程通过add、remove、clear等方法，改变了modCount的值)；这时，就会抛ConcurrentModificationException异常，产生fail-fast事件。

1.7 扩容

1.7扩容时需要重新计算哈希值和索引位置，1.8并不重新计算哈希值，巧妙地采用和扩容后容量进行&操作来计算新的索引位置。

三、源码分析（1.8）

2.1 HashMap的几个重要默认参数

初始数组容量默认为16,负载因子为0.75。也就是说大小为16的HashMap的数组中，有数据量超过13时，就会扩容成32。

超过8个转化成红黑树？

在理想情况下，使用随机哈希码，节点出现的频率在hash桶（形成的链表）中遵循泊松分布。也就是说链表长度超过8个，概率是百万分之6，但是超过8个影响了性能，因此能不转换成红黑树就不要转化。

变树变链表

链表长度超过8个就会将链表转换为红黑树，长度低于6个就会将红黑树转化成链表。这里可以理解成避免扩容缩容会产生震荡。扩一次缩一次。为什么是8呢，因为太长会降低性能。之前也分析过，超过8的情况很少，但是还是有，如果有那就转用更高效的红黑树。

图片说明

1.8扩容机制

1.7扩容是重新计算，但是1.8不同，利用新增的一位要么是1要么是0，决定元素要么在原来的位置，要么在原位置在移动2次幂的位置。这样也保证了均匀性。

全部评论

推荐最新楼层

昨天 22:20

已编辑

北京航空航天大学算法工程师

字节国际广告实习一面过二面挂

一面： 十亿费用宣发会怎么选 手撕反转链表 二面： layer norm是什么，和bantch norm有什么区别 手撕一个layer norm实现 重点： 机器学习基础比较重要最后hr都会问“你还有什么问题想问我吗”：请问您觉得我在今天的面试当中有哪个环节答的好，或者有哪个环节的回答您特别不喜欢，您有什么好的改进建议？

查看5道真题和解析

点赞评论收藏

03-30 18:45

门头沟学院 Java

慢脚AI开发二面

1. 你的RAG项目主要什么作用2. RAG项目工作流程是什么3. 你的RAG项目出现问题，怎么进行排错4. 大模型微调过程中数据预处理的步骤有哪些？5. 如何解决大模型Agent的工具调用 幻觉问题？6. LoRA微调技术是什么？7. 大模型Agent的记忆机制分为哪几类？8. 大模型后端部署常用的框架有哪些？9. 全参数微调与轻量化微调的适用场景分别是什么？10. 大模型Agent实现复杂任务规划的核心方法有哪些？11. 大模型推理服务的性能优化手段有哪些？12. 如何设计大模型微调后的效果评估体系？13. 大模型Agent对接第三方API时，后端如何做接口鉴权、限流与异常捕获？14. 大...

查看22道真题和解析

点赞评论收藏

03-31 14:46

已编辑

门头沟学院 Web前端

绷不住了

励志成为双港第一ja...：这其实很正常，离的太远了，他认为你不会来，就为了混个面试，而且成本很高，实习生都优先选本地高校。吃了地域的亏，所有很多时候地域可能比院校层次更重要。

点赞评论收藏

02-28 13:25

已编辑

门头沟学院 Java

这种简历可以吗，大四

大四学院本 想冲刺一下春招但是学历直接被刷不知道是不是简历问题有没有牛油帮忙锐评一下

怎么起名字：学历问题，学院别碰后端，测试和前端运维实施可以看看

你的秋招简历被谁挂了？

点赞评论收藏

03-27 21:02

清华大学 Java

小米 Java 软件开发工程师一面面经

1. 你的项目中使用了消息队列（MQ），如何保证消息的可靠性投递（不丢失）？回答：保证可靠性需要从三个阶段入手： 生产者阶段：开启确认机制（如 RabbitMQ 的 Confirm 模式或 RocketMQ 的同步发送）。发送失败时进行重试，或者记录日志入库。MQ 节点阶段：开启持久化（交换机、队列、消息全部持久化到磁盘）。如果是集群环境，使用镜像队列或多副本同步，确保 Leader 宕机后数据不丢。消费者阶段：关闭自动 ACK，改为手动 ACK。只有在业务逻辑处理成功后才返回确认，防止消息在处理中途由于异常丢失。2. 谈谈 Netty 的高性能架构，为什么它比传统的 Tomcat 连接器更快...

查看20道真题和解析

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 面试被问到不会的问题，你怎么应对？ #

# 开放七大实习专项，百度暑期实习值得冲吗 #

# 你都用vibe coding做过什么？ #

# Vibe Coding 会干掉初级岗位吗？ #

12440次浏览 168人参与

# 大厂实习和小厂实习最大的区别是什么？ #

25339次浏览 194人参与

# 如果人生可以debug你会改哪一行? #

5717次浏览 102人参与

# 网易游戏雷火笔试 #

4029次浏览 66人参与