回答
ArrayList
在添加元素时,如果内部数组已满,则会自动执行扩容操作,通常是将当前容量增加到原来的 1.5 倍。共分为如下几个步骤:
- 计算新容量:一般新容量 = 旧容量 * 1.5,也就是增长 50%。
- 创建新数组:
ArrayList
新建一个新的数组,其容量为计算得出的新容量。 - 元素复制:使用
System.arraycopy()
将旧数组中的所有元素复制到新数组中。 - 引用更新:复制完成后,
ArrayList
的内部引用会从旧数组更新到新数组,旧数组随后会被垃圾回收处理。
由于扩容会涉及数组元素的复制,代价较大,所以在添加大量元素之前预估并指定一个合理的初始容量,可以减少扩容操作的次数,从而优化性能。
详解
ArrayList
底层是基于数组实现的列表数据结构,它提供了动态数组的功能。当元素数量超过数组当前容量时,ArrayList
会自动增加存储容量以容纳更多元素。这个过程通常称为“扩容”。
在调用 add()
的时候,ArrayList
都会调用 ensureCapacityInternal()
来确认是否需要扩容:
private void ensureCapacityInternal(int minCapacity) {
ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
}
- calculateCapacity() :计算
ArrayList
内部数组的容量
private static int calculateCapacity(Object[] elementData, int minCapacity) {
// 检查当前数组是否为默认大小的空数组实例
if (elementData == DEFAULTCAPACITY_EMPTY_ELEMENTDATA) {
return Math.max(DEFAULT_CAPACITY, minCapacity);
}
return minCapacity;
}
DEFAULTCAPACITY_EMPTY_ELEMENTDATA
是 ArrayList
中一个特殊的静态常量,用于表示一个空的数组实例。若 elementData
是 DEFAULTCAPACITY_EMPTY_ELEMENTDATA
,说明 ArrayList
是新创建的且尚未添加任何元素,此时需要决定一个起始容量。记住,当我们直接调用 new ArrayList()
新建 ArrayList
对象时,其内部数组就是 DEFAULTCAPACITY_EMPTY_ELEMENTDATA
:
public ArrayList() {
this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
}
说明此时,ArrayList
是一个没有容量的空数组,当我们第一次调用 add()
添加元素时,需要给于 ArrayList
一个初始容量 DEFAULT_CAPACITY
(10)。所以如果不指定初始容量的话,第一次调用 add()
就会执行扩容操作。
那为什么不直接 new 一个
DEFAULT_CAPACITY
容量的数组呢?大明哥猜测可能是为了延迟初始化吧,即只在实际需要时才会初始化数组,避免了在ArrayList
对象生命周期中可能根本不需要的内存分配。
确定容量后,调用 ensureExplicitCapacity() 判断是否需要扩容:
private void ensureExplicitCapacity(int minCapacity) {
modCount++;
// 扩容
if (minCapacity - elementData.length > 0)
grow(minCapacity);
}
grow()
扩容:
private void grow(int minCapacity) {
// overflow-conscious code
int oldCapacity = elementData.length;
// 1.5 倍
int newCapacity = oldCapacity + (oldCapacity >> 1);
if (newCapacity - minCapacity < 0)
newCapacity = minCapacity;
if (newCapacity - MAX_ARRAY_SIZE > 0)
newCapacity = hugeCapacity(minCapacity);
// 复制数据
elementData = Arrays.copyOf(elementData, newCapacity);
}
扩容操作是一个代价较大的操作,所以在添加大量元素之前预估并指定一个合理的初始容量,可以减少扩容操作的次数,从而优化性能。