《Java源码分析》：WeakHashMap

这篇博文就来看下WeakHashMap这个类的源码。博文的思路也是从继承结构、构造方法、常见的方法这些方面来分析WeakHashMap这个类的源码。

说明：WeakHashMap也是一个“数组和链表”的结合体

1、WeakHashMap的继承结构

        public class WeakHashMap<K,V>
            extends AbstractMap<K,V>
            implements Map<K,V>

WeakHashMap与HashMap一样，都是继承AbstractMap并实现了Map接口。与HashMap的区别在于并没有实现Cloneable和Serializable接口，这就导致WeakHashMap对象不能被克隆和序列化。

2、WeakHashMap的主要属性

源码中对这些属性的注释写的清晰好懂，我都舍不得对她进行翻译，怕对其都是一种践踏。因此，这里源码我就直接贴出来了。

想了想，这里还是对其进行说明下：

1、DEFAULT_INITIAL_CAPACITY=16：为默认容量

2、MAXIMUM_CAPACITY = 1 << 30;表示WeakHashMap所能分配空间的最大容量

3、DEFAULT_LOAD_FACTOR = 0.75f;默认加载因子

4、Entry

            /**
             * The default initial capacity -- MUST be a power of two.
             */
            private static final int DEFAULT_INITIAL_CAPACITY = 16;
    
            /**
             * The maximum capacity, used if a higher value is implicitly specified
             * by either of the constructors with arguments.
             * MUST be a power of two <= 1<<30.
             */
            private static final int MAXIMUM_CAPACITY = 1 << 30;
    
            /**
             * The load factor used when none specified in constructor.
             */
            private static final float DEFAULT_LOAD_FACTOR = 0.75f;
    
            /**
             * The table, resized as necessary. Length MUST Always be a power of two.
             */
            Entry<K,V>[] table;
    
            /**
             * The number of key-value mappings contained in this weak hash map.
             */
            private int size;
    
            /**
             * The next size value at which to resize (capacity * load factor).
             */
            private int threshold;
    
            /**
             * The load factor for the hash table.
             */
            private final float loadFactor;
    
            /**
             * Reference queue for cleared WeakEntries
             */
            private final ReferenceQueue<Object> queue = new ReferenceQueue<>();

2、WeakHashMap的构造函数

下面这个构造函数和HashMap的构造函数基本一模一样。构造函数所做的事又如下两点：1）先对容量进行了有效性检查，如果有效，则开辟一个2的幂次方大小的数组空间，其中这个2的幂次方大于等于initialCapacity。

源码如下：(添加了一点注释)

        /*
            其它的构造方法都是调用此构造方法
            参数说明：
            initialCapacity：容量大小，默认值为 16
            loadFactor：加载因此，默认值为0.75
        */
        public WeakHashMap(int initialCapacity, float loadFactor) {
            if (initialCapacity < 0)
                throw new IllegalArgumentException("Illegal Initial Capacity: "+
                                                   initialCapacity);
            if (initialCapacity > MAXIMUM_CAPACITY)
                initialCapacity = MAXIMUM_CAPACITY;
    
            if (loadFactor <= 0 || Float.isNaN(loadFactor))
                throw new IllegalArgumentException("Illegal Load factor: "+
                                                   loadFactor);
            int capacity = 1;
            //保证容量为2的幂次方
            while (capacity < initialCapacity)
                capacity <<= 1;
            //分配数组空间
            table = newTable(capacity);
            this.loadFactor = loadFactor;
            //扩容门限有容量和加载因子的乘积决定
            threshold = (int)(capacity * loadFactor);
        }
    
    
        private Entry<K,V>[] newTable(int n) {
            return (Entry<K,V>[]) new Entry<?,?>[n];
        }

3、WeakHashMap中常见的一些方法介绍

对于所有的容器，添加元素和取得元素是两个最基本的方法。因此，这是我们研究的重点。对于WeakHashMap，添加元素的方法为：V put(K key, V value);根据key取得元素的方法为：V get(Object key)。

下面我们将分别详细的介绍这两个方法的原理。

3.1、put(K key, V value)介绍

此方法的功能为：向WeakHashMap中添加键值对

由于WeakHashMap与HashMap基本类似，因此，put方法的思路也基本一致。

具体如下：

第一步：检查key是否为null，如果为null，则将key用一个Object常量代替：NULL_KEY。在HashMap中是没有进行这样一个替代转换的,而是直接用null作为key存在在HashMap对象中。这是他们其中的一个区别

第二步：取得key的hash值，

第三步：根据hash值找到其在table的存储位置 i 。

第四步：由于table的每个位置存储的可能是一个链表，因此，在此位置 i处的链表中检测是否有此key存在，如果有，则更新其key所对应的value即可。如果没有此key，则将此节点加入到此链表的头结点位置。

在进行上面的4个步骤中，在第四步之前涉及到一个expunge Stale
Entries in table(翻译：在table中删除过时的条目)的一个处理。这个是在HashMap中没有的。

put方法（包括此方法中调用方法）源码如下：(添加了相关的注释)

        public V put(K key, V value) {
            /*
                第一步：对key进行是否为null的检测，如果为null，
                        则将key用一个Object常量代替：NULL_KEY
            */
            Object k = maskNull(key);
            /*
                第二步：取得key的hash值
            */
            int h = hash(k);
            Entry<K,V>[] tab = getTable();
            //第三步：根据key的hash值算出其在数组table中的存储位置i
            int i = indexFor(h, tab.length);
    
            /*
                第四步：检测存储位置中已存在的节点中是否已经此key了，
                        如果有，则更新value即可
                        如果没有，则把此节点添加在此位置的链表头
    
            */
            for (Entry<K,V> e = tab[i]; e != null; e = e.next) {
                if (h == e.hash && eq(k, e.get())) {
                    V oldValue = e.value;
                    if (value != oldValue)
                        e.value = value;
                    return oldValue;
                }
            }
            modCount++;
            //由于每个位置可能是一个链表，因此，将新节点加入到此位置的head位置
            Entry<K,V> e = tab[i];
            tab[i] = new Entry<>(k, value, queue, h, e);
            //检测是否需要扩容
            if (++size >= threshold)
                resize(tab.length * 2);
            return null;
        }
    
        private static final Object NULL_KEY = new Object();
    
        /**
         * Use NULL_KEY for key if it is null.
         */
        private static Object maskNull(Object key) {
            return (key == null) ? NULL_KEY : key;
        }
    
    
        final int hash(Object k) {
            int h = k.hashCode();
    
            // This function ensures that hashCodes that differ only by
            // constant multiples at each bit position have a bounded
            // number of collisions (approximately 8 at default load factor).
            h ^= (h >>> 20) ^ (h >>> 12);
            return h ^ (h >>> 7) ^ (h >>> 4);
        }
        private Entry<K,V>[] getTable() {
            expungeStaleEntries();
            return table;
        }
        /**
         * Expunges stale entries from the table.
         *翻译：删除过时的条目，即将ReferenceQueue队列中的对象引用全部在table中给删除掉
         *思路：如何删除一个table的节点e，方法为：首先计算e的hash值，接着根据hash值找到其在table的位置，然后遍历链表即可。
         */
        private void expungeStaleEntries() {
            for (Object x; (x = queue.poll()) != null; ) {
                synchronized (queue) {
                    @SuppressWarnings("unchecked")
                        Entry<K,V> e = (Entry<K,V>) x;
                    int i = indexFor(e.hash, table.length);
    
                    Entry<K,V> prev = table[i];
                    Entry<K,V> p = prev;
                    while (p != null) {
                        Entry<K,V> next = p.next;
                        if (p == e) {
                            if (prev == e)
                                table[i] = next;
                            else
                                prev.next = next;
                            // Must not null out e.next;
                            // stale entries may be in use by a HashIterator
                            e.value = null; // Help GC
                            size--;
                            break;
                        }
                        prev = p;
                        p = next;
                    }
                }
            }
        }
    
        private static int indexFor(int h, int length) {
            return h & (length-1);//当length为2的幂次方时，等价于h%length
        }

3.1.1、resize(int newCapacity)介绍

对于任何容器，当存储数据的空闲位置到达门限时，都会进行扩容，WeakHashMap也不例外，因此，也有必要分析下此类的resize()方法。

扩容其实思想特简单，就是分配一个是原来空间的2倍的数组空间，接着进行一个数组的拷贝即可。其中，在进行上面步骤的过程中，涉及到一个特殊情况的处理。

方法的源码如下：(有一点主要注意：在tranfer方法中用到了Entry类的get方法，这个方法是WeakReference的父类Reference中的方法，此方法的功能是：获得该引用所指示的对象)

       /*
            函数的功能：扩容
    
        */
        void resize(int newCapacity) {
            Entry<K,V>[] oldTable = getTable();
            int oldCapacity = oldTable.length;
            //如果table所分配的空间已经是最大值，则还继续使用，不进行扩容
            if (oldCapacity == MAXIMUM_CAPACITY) {
                threshold = Integer.MAX_VALUE;
                return;
            }
    
            Entry<K,V>[] newTable = newTable(newCapacity);
            transfer(oldTable, newTable);
            table = newTable;
    
            /*
             * If ignoring null elements and processing ref queue caused massive
             * shrinkage, then restore old table.  This should be rare, but avoids
             * unbounded expansion of garbage-filled tables.
             */
            if (size >= threshold / 2) {
                threshold = (int)(newCapacity * loadFactor);
            } else {
                expungeStaleEntries();
                transfer(newTable, oldTable);
                table = oldTable;
            }
        }
    
        /** Transfers all entries from src to dest tables */
        private void transfer(Entry<K,V>[] src, Entry<K,V>[] dest) {
            for (int j = 0; j < src.length; ++j) {
                Entry<K,V> e = src[j];
                src[j] = null;
                while (e != null) {
                    Entry<K,V> next = e.next;
                    Object key = e.get();//得到引用对象WeakReference所指示的对象
                    if (key == null) {
                        e.next = null;  // Help GC
                        e.value = null; //  "   "
                        size--;
                    } else {
                        int i = indexFor(e.hash, dest.length);
                        e.next = dest[i];
                        dest[i] = e;
                    }
                    e = next;
                }
            }
        }

3.2、get(Object key)介绍

上面介绍了put方法的思想，get方法实现的思想就相当简单了，get方法是想的思想具体如下：

get方法实现的思想与put的前3不是一模一样的。

第二步：取得key的hash值，

第三步：根据hash值找到其在table的存储位置 i 。

第四步：由于table的每个位置存储的可能是一个链表，因此，在此位置 i处的链表中检测是否有此key存在，如果有，则取出其对应的value并返回即可。如果没有此key，则返回null。

源码如下：(有了上面put方法的思想，理解下面的源码就比较简单了，这里就没有写注释，如果不懂，可以参考put方法中详细的注释)

        public V get(Object key) {
            Object k = maskNull(key);
            int h = hash(k);
            Entry<K,V>[] tab = getTable();
            int index = indexFor(h, tab.length);
            Entry<K,V> e = tab[index];
            while (e != null) {
                if (e.hash == h && eq(k, e.get()))
                    return e.value;
                e = e.next;
            }
            return null;
        }

3.3、containsKey(Object key)介绍

这里的containKey方法与上面介绍的get、put方法的实现思想类似。

源码如下：

        public boolean containsKey(Object key) {
            return getEntry(key) != null;
        }
    
        /**
         * Returns the entry associated with the specified key in this map.
         * Returns null if the map contains no mapping for this key.
         */
        Entry<K,V> getEntry(Object key) {
            Object k = maskNull(key);
            int h = hash(k);
            Entry<K,V>[] tab = getTable();
            int index = indexFor(h, tab.length);
            Entry<K,V> e = tab[index];
            while (e != null && !(e.hash == h && eq(k, e.get())))
                e = e.next;
            return e;
        }

3.4、remove(Object key)

remove方法也是我们在使用容器过程中，用的相当多的方法之一。因此也要必要进行介绍。

remove方法的思想：先根据key找到其在table的位置，然后就转换为了一个在链表中删除某一个节点的问题了。

具体思想描述如下：

第二步：取得key的hash值，

第三步：根据hash值找到其在table的存储位置 i 。

第四步：由于table的每个位置存储的可能是一个链表，因此就转化为了一个在删除链表中某一个节点的问题了。

        public V remove(Object key) {
            Object k = maskNull(key);
            int h = hash(k);
            Entry<K,V>[] tab = getTable();
            int i = indexFor(h, tab.length);
            Entry<K,V> prev = tab[i];
            Entry<K,V> e = prev;
    
            while (e != null) {
                Entry<K,V> next = e.next;
                if (h == e.hash && eq(k, e.get())) {
                    modCount++;
                    size--;
                    if (prev == e)
                        tab[i] = next;
                    else
                        prev.next = next;
                    return e.value;
                }
                prev = e;
                e = next;
            }
    
            return null;
        }

3.5、其它方法介绍

下面是size()方法与之所以拿出来分析下，是因为，这个方法与HashMap方法中size()不一样。在HashMap中的size()方法中，仅仅是返回数组table中存储数据的长度，而这里的size()方法在返回长度之前做了一个：”删除table中过时的数据”这里一个操作，然后才返回数组存储数据的长度的，即返回的是table中真正有意义的数据。这也是HashMap与WeakHashMap的区别之一

        public int size() {
            if (size == 0)
                return 0;
            expungeStaleEntries();
            return size;
        }
    
        /**
         * Returns <tt>true</tt> if this map contains no key-value mappings.
         * This result is a snapshot, and may not reflect unprocessed
         * entries that will be removed before next attempted access
         * because they are no longer referenced.
         */
        public boolean isEmpty() {
            return size() == 0;
        }

总结

WeakHashMap和HashMap一样，WeakHashMap也是一个散列表，它存储的内容也是键值对(key-value)映射，而且键和值都可以为null。不过WeakHashMap的键时“弱键”，当WeakHashMap某个键不再正常使用时，会被从WeakHashMap自动删除。更精确的说，对于一个给定的键，其映射的存在并不能阻止垃圾回收器对该键的丢弃，这就使该键称为被终止的，被终止，然后被回收，这样，这就可以认为该键值对应该被WeakHashMap删除。因此，WeakHashMap使用了弱引用作为内部数据的存储方案，，WeakHashMap可以作为简单缓存表的解决方案，当系统内存不足时，垃圾收集器会自动的清除没有在任何其他地方被引用的键值对。如果需要用一张很大的Map作为缓存表时，那么可以考虑使用WeakHashMap。

关于WeakHashMap与HashMap的更多区别请看下篇博文。

Java 面试宝典是大明哥全力打造的 Java 精品面试题，它是一份靠谱、强大、详细、经典的 Java 后端面试宝典。它不仅仅只是一道道面试题，而是一套完整的 Java 知识体系，一套你 Java 知识点的扫盲贴。

它的内容包括：

大厂真题：Java 面试宝典里面的题目都是最近几年的高频的大厂面试真题。
原创内容：Java 面试宝典内容全部都是大明哥原创，内容全面且通俗易懂，回答部分可以直接作为面试回答内容。
持续更新：一次购买，永久有效。大明哥会持续更新 3+ 年，累计更新 1000+，宝典会不断迭代更新，保证最新、最全面。
覆盖全面：本宝典累计更新 1000+，从 Java 入门到 Java 架构的高频面试题，实现 360° 全覆盖。
不止面试：内容包含面试题解析、内容详解、知识扩展，它不仅仅只是一份面试题，更是一套完整的 Java 知识体系。
宝典详情：https://www.yuque.com/chenssy/sike-java/xvlo920axlp7sf4k
宝典总览：https://www.yuque.com/chenssy/sike-java/yogsehzntzgp4ly1
宝典进展：https://www.yuque.com/chenssy/sike-java/en9ned7loo47z5aw

目前 Java 面试宝典累计更新 400+ 道，总字数 42w+。大明哥还在持续更新中，下图是大明哥在 2024-12 月份的更新情况：

想了解详情的小伙伴，扫描下面二维码加大明哥微信【daming091】咨询

同时，大明哥也整理一套目前市面最常见的热点面试题。微信搜[大明哥聊 Java]或扫描下方二维码关注大明哥的原创公众号[大明哥聊 Java] ，回复【面试题】即可免费领取。

阅读全文