2022-07-16 20:26 辽宁大学 Java

关注

【应届面试篇】谈一谈HashMap - 附源码解读

前言

复习时整理的资料，有不对不足的地方欢迎大佬给出意见。

HashMap

一、HasMap概括

HashMap是一种采取K-V结构的高校存储的数据结构，通过hash算法使得其最优复杂度在O(1)。
HashMap的基本数据结构在jdk1.7是数组+链表，jdk1.8后为数组加链表加红黑树。

二、通过源码解读HashMap基本数据结构

要想了解HashMap的基本实现，那我们先看HashMap类中的静态常量。

    //初始容量
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
    //最大容量 
    static final int MAXIMUM_CAPACITY = 1 << 30;
    //扩容因子
    static final float DEFAULT_LOAD_FACTOR = 0.75f;
    //转化为红黑树的最小链表长度
    static final int TREEIFY_THRESHOLD = 8;
    //红黑树退化为链表的最小长度
    static final int UNTREEIFY_THRESHOLD = 6;
    //转化为红黑树的最小数组容量
    static final int MIN_TREEIFY_CAPACITY = 64;

HashMap数组初始化容量为16
扩容因子为0.75，即数组被填满75%会进行扩容
当链表长度大于8数组容量大于64 链表会转化为红黑树
当红黑树结点少于6会退化为链表
看完常量我们再来开put方法*
put方法是比较能全面的理解HashMap数据结构的
先看put方法

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

很多人可能都不知道忽视了 put方法还是有返回值的，当一个Key的值被更新时他的就val值会被返回。
put方法看起来很简单就是直接调用了putVal方法，putVal方法后面的两个参数对初级面试来说意义不大就是控制是否返回旧值的。

那我们继续看putVal方法

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node[] tab; Node p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

这里就是整个put流程的核心了，也狠生动的解读了数组加链表加红黑树。

putVal朴实无华，没有用到什么设计模式，一把if梭哈到低。那就按照分支结构从上到下解读一下。

上来第一个判断就是table是否为空这个table是什么

transient Node[] table;

这个table就是一个全局变量，他是一个Node数组，这就是我们常说的HashMap中的数组
来看一下Node

static class Node implements Map.Entry {
        final int hash;
        final K key;
        V value;
        Node next;  
    }

我们可以看到Node是一个静态内部类 (我这里只保留了内部变量减少篇幅）除了他的hash值K、V以外还有一个next指针，所以说我们的HashMap中的链表是单链表。

回到putVal方法中

if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
当数组为空的时候会调用resize方法对数组初始化，所以说hashmap的数组是懒加载机制

往下说putVal的方法

if ((p = tab[i = (n - 1) & hash]) == null)
这句很简单就是此时数组对应的这个位置如果为空的话，直接在上面新建一个Node，跟链表和红黑树显然就没什么关系了；
否则的话那就要跟链表和数组扯上关系了。

下面是一个三向的分支展开说

如果信加入的这个结点就是当前数组index的头结点，那么直接替换且返回就好了
第二个分支用了一个关键字instanceof他是用来判断是不是同一个类型的，就是判断我们当前数组index是否已经进化成为红黑树了，如果是那么就调用红黑树的那套逻辑（不多说了，就是左旋右旋什么的）
第三个分支就只用一种情况了，那么就是当前是一个链表，这里写的很简练但核心意思一样就是便利这个链表，他们的hash一定都是一样的，要不断判断equals，如果equals相等则替换返回，否则加在链表尾端；

说完了这些，可能发现下面还有一个if (e != null) { // existing mapping for key
这个就是控制如果被替换了要不要返回旧值的

最后通过对putVal的解读，已经基本讲清楚了为什么以及什么是链表加数组加红黑树了

同时这里还会引申出一个问题,HashMap是线程安全的嘛？

答案是不安全的。
原因很简单，不多赘述了，在插入新值时寻找对应位置和向对应位置加入新节点这个操作 不是原子操作，如果并发的两个线程都找到了同一个位置且都向这一个位置添加新值，那么就会发生覆盖！
如果要保证线程安全，可以使用ConcurrentHashMap 或 HashTable；后面会详细说ConcurrentHashMap 。

顺便也简单说一下resize方法吧

HashMap扩容是二倍扩容，会新建一个数组在resize方法中有一个for循环里面嵌套了一个do-while循环，for循环就是便利我们的数组，do-while遍历下面的链表，将所有元素都迁移至新的table中。

ConcurrentHashMap

ConcurrentHashMap概括

ConcurrentHashMap是线程安全的HashMap，同时HashTable也是一个线程安全的HashMap，但是HashTable是一个遗留类，HashTable锁的是全表所以并发度只用1。但是ConcurrentHashMap在1.8中锁的是链表头，所以理论上数组有多大并发度就有多大。

ConcurrentHashMap如何保重线程安全

先说putVal方法

附上源码有点多，不想看直接看解释也行。

final V putVal(K key, V value, boolean onlyIfAbsent) {
        if (key == null || value == null) throw new NullPointerException();
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node[] tab = table;;) {
            Node f; int n, i, fh;
            if (tab == null || (n = tab.length) == 0)
                tab = initTable();
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
                if (casTabAt(tab, i, null,
                             new Node(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
                V oldVal = null;
                synchronized (f) {
                    if (tabAt(tab, i) == f) {
                        if (fh >= 0) {
                            binCount = 1;
                            for (Node e = f;; ++binCount) {
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node pred = e;
                                if ((e = e.next) == null) {
                                    pred.next = new Node(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        else if (f instanceof TreeBin) {
                            Node p;
                            binCount = 2;
                            if ((p = ((TreeBin)f).putTreeVal(hash, key,
                                                           value)) != null) {
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        addCount(1L, binCount);
        return null;
    }

流程上与 HashMap区别并不大
当对应数组index为空时，会用CAS进行加锁
当对应数组index为链表或红黑树时，会直接使用synchronized锁头

在这里要提 jdk1.7是使用的分段锁

jdk1.7是使用大表套小表ConcurrentHashMap下最多有16个 Segment，
锁的是 Segment ，所以最大并发量只有16.

static class Segment extends ReentrantLock implements Serializable

这里可以看到 Segment 继承了ReentrantLock 所以锁是使用到的ReentrantLock

说完putVal再说resize

ConcurrentHashMap的resize方法是支持多个线程共同协助完成的，使用到的也是CAS锁

#面试##java##Java源码##秋招##提前批#

全部评论

推荐最新楼层

爱交友的芭乐求offer

华东交通大学理工学院 Java

不是数组被填满是元素个数

点赞回复分享

发布于 2022-09-04 12:10 江西

TimeStory

西安文理学院 Java

大佬，真真的大佬！

点赞回复分享

发布于 2022-08-02 17:37

04-15 20:32

中国传媒大学数据分析师

数据分析实习 + 产品运营实习高频面试题，

  一、数据分析实习面试题  1. 自我介绍 & 岗位认知 简单做个自我介绍 你为什么想做数据分析？ 你理解的数据分析实习是做什么的？ 你觉得自己适合数据分析的优势是什么？  2. 技能基础（实习最常问） 会用哪些数据分析工具？（Excel/SQL/Python/BI） Excel 常用函数有哪些？vlookup/xlookup/pivot table 用过吗？ SQL 会不会联表查询？left join 和 inner join 区别？ 会不会用 group by、having、order by？ Python 用过 pandas 做数据处理吗？ 了解哪些基础统计指标？均值、中位数、...

点赞评论收藏

04-17 16:20

北京邮电大学 Java

腾讯 CSIG 后台开发一面

自我介绍对未来的从业方向和技术栈有没有规划或偏好实习Redis Pipeline 是原子性的吗Pipeline 部分成功，如何定位以及解决八股JAVA 语言的垃圾回收机制在 JAVA 中是如何使用线程的如何定位和解决线程池满的情况Redis 支持哪些数据结构Redis Zset 在数据量比较小时，底层采用的数据结构算法在存储引擎为 InnoDB 的 MySQL 中，分页获取数据（每页有 10 条），如何获得第 50w 页的数据二叉树的后序遍历（非递归实现）

查看10道真题和解析

点赞评论收藏

04-11 10:15

已编辑

门头沟学院 Java

28届双非本腾讯开发实习oc

如题，tl：3.3 投递3.9 一面3.17 二面3.25 三面3.26 hr面4.1 offer给同样面了腾讯的同志们一点参考。说好的字节才是双非友好大厂呢，为什么我简历是投一次锁一次，以后要当节恨子！鹅是人生第一次面试，本来以为要挂几次，没想到流程还算顺利，初面就直接给我过了，我要感谢腾讯，感谢面试官，感谢hr，感谢所有人。真心是体会到了，找日常实习就是七分运气三分实力。鹅的黑卡有点帅

喵_coding：666，28届开挂了

我的OC时间线

点赞评论收藏

03-20 15:12

香港浸会大学数据分析师

26应届投简历投麻了

感觉就是那种，背景也不够硬，实习也不够硬，啥都不够硬，除了硬着头皮在各个招聘软件和官网平台投没有任何收获，已经不知道自己能干啥了……

想减肥的布莱克最喜欢...：一样，投麻了，没实习，学历比不上你，人麻的已经不知道该干啥，学啥了

点赞评论收藏

招聘动态

AI网申助手

网申字段一键填写

龙湖集团数字科技平台

2026届春季招聘&实习生招聘

阿里巴巴集团

2027届实习生校园招聘

招商银行数字金融训练营

火热报名中

联想

27届暑期实习

厦门银行

2026届春季校园招聘

联想

26届补录

27届校招宝典

滴滴

2027届秋招储备实习生招聘

快手

27届实习超多转正机会

全站热榜

创作者周榜

正在热议

# 华泰星战营，提前锁定校招offer #

# 不考虑薪资和职业，你最想做什么工作呢？ #

【应届面试篇】谈一谈HashMap - 附源码解读

前言

HashMap

一、HasMap概括

二、通过源码解读HashMap基本数据结构

这里就是整个put流程的核心了，也狠生动的解读了数组加链表加红黑树。

上来第一个判断就是table是否为空 这个table是什么

回到putVal方法中

往下说putVal的方法

下面是一个三向的分支 展开说

同时这里还会引申出一个问题,HashMap是线程安全的嘛？

顺便也简单说一下resize方法吧

ConcurrentHashMap

ConcurrentHashMap概括

ConcurrentHashMap如何保重线程安全

先说putVal方法

在这里要提 jdk1.7是使用的分段锁

说完putVal再说resize

全站热榜

创作者周榜

上来第一个判断就是table是否为空这个table是什么

下面是一个三向的分支展开说