Java ArrayList迭代

Java ArrayList迭代器,我们来看一个ArrayList的常见操作:迭代。我们看一个迭代操作的例子,循环打印ArrayList中的每个元素,ArrayList支持foreach语法:

ArrayList<Integer> intList = new ArrayList<Integer>();
intList.add(123);
intList.add(456);
intList.add(789);
for(Integer a : intList){
    System.out.println(a);
}

输出结果:
Java ArrayList迭代

当然,这种循环也可以使用如下代码实现:

for(int i=0; i<intList.size(); i++){
    System.out.println(intList.get(i));
}

不过,foreach看上去更为简洁,而且它适用于各种容器,更为通用。

这种foreach语法背后是怎么实现的呢?其实,编译器会将它转换为类似如下代码:

Iterator<Integer> it = intList.iterator();
while(it.hasNext()){
    System.out.println(it.next());
}

接下来,我们解释其中的代码。
1.迭代器接口
ArrayList实现了Iterable接口,Iterable表示可迭代,Java 7中的定义为:

public interface Iterable<T> {
    Iterator<T> iterator();
}

定义很简单,就是要求实现iterator方法。iterator方法的声明为:

public Iterator<E> iterator()

它返回一个实现了Iterator接口的对象,Java 7中Iterator接口的定义为:

public interface Iterator<E> {
    boolean hasNext();
    E next();
    void remove();
}

hasNext()判断是否还有元素未访问,next()返回下一个元素,remove()删除最后返回的元素,只读访问的基本模式类似于:

Iterator<Integer> it = intList.iterator();
while(it.hasNext()){
    System.out.println(it.next());
}

只要对象实现了Iterable接口,就可以使用foreach语法,编译器会转换为调用Iterable和Iterator接口的方法。初次见到Iterable和Iterator,可能会比较容易混淆,我们再澄清一下:

  • Iterable表示对象可以被迭代,它有一个方法iterator(),返回Iterator对象,实际通过Iterator接口的方法进行遍历;
  • 如果对象实现了Iterable,就可以使用foreach语法;
  • 类可以不实现Iterable,也可以创建Iterator对象。

需要了解的是,Java 8对Iterable添加了默认方法forEach和spliterator,对Iterator增加了默认方法forEachRemaining和remove,具体可参见API文档,我们就不介绍了。

2. ListIterator
除了iterator(), ArrayList还提供了两个返回Iterator接口的方法:

public ListIterator<E> listIterator()
public ListIterator<E> listIterator(int index)

ListIterator扩展了Iterator接口,增加了一些方法,向前遍历、添加元素、修改元素、返回索引位置等,添加的方法有:

public interface ListIterator<E> extends Iterator<E> {
    boolean hasPrevious();
    E previous();
    int nextIndex();
    int previousIndex();
    void set(E e);
    void add(E e);
}

listIterator()方法返回的迭代器从0开始,而listIterator(int index)方法返回的迭代器从指定位置index开始。比如,从末尾往前遍历,代码为:

public void reverseTraverse(List<Integer> list){
    ListIterator<Integer> it = list.listIterator(list.size());
    while(it.hasPrevious()){
        System.out.println(it.previous());
    }
}

3.迭代的陷阱
关于迭代器,有一种常见的误用,就是在迭代的中间调用容器的删除方法。比如,要删除一个整数ArrayList中所有小于100的数,直觉上,代码可以这么写:

public void remove(ArrayList<Integer> list){
    for(Integer a : list){
        if(a<=100){
            list.remove(a);
        }
    }
}

但运行时会抛出异常:

java.util.ConcurrentModificationException

发生了并发修改异常,为什么呢?因为迭代器内部会维护一些索引位置相关的数据,要求在迭代过程中,容器不能发生结构性变化,否则这些索引位置就失效了。所谓结构性变化就是添加、插入和删除元素,只是修改元素内容不算结构性变化。

如何避免异常呢?可以使用迭代器的remove方法,如下所示:

public static void remove(ArrayList<Integer> list){
    Iterator<Integer> it = list.iterator();
    while(it.hasNext()){
        if(it.next()<=100){
            it.remove();
        }
    }
}

迭代器如何知道发生了结构性变化,并抛出异常?它自己的remove方法为何又可以使用呢?我们需要看下迭代器实现的原理。

4.迭代器实现的原理
我们来看下ArrayList中iterator方法的实现,代码为:

public Iterator<E> iterator() {
    return new Itr();
}

新建了一个Itr对象,Itr是一个成员内部类,实现了Iterator接口,声明为:

private class Itr implements Iterator<E>

它有三个实例成员变量,为:

int cursor;        //下一个要返回的元素位置
int lastRet = -1; //最后一个返回的索引位置,如果没有,为-1
int expectedModCount = modCount;

cursor表示下一个要返回的元素位置,lastRet表示最后一个返回的索引位置,expected-ModCount表示期望的修改次数,初始化为外部类当前的修改次数modCount,回顾一下,成员内部类可以直接访问外部类的实例变量。每次发生结构性变化的时候modCount都会增加,而每次迭代器操作的时候都会检查expectedModCount是否与modCount相同,这样就能检测出结构性变化。

我们来具体看下,它是如何实现Iterator接口中的每个方法的,先看hasNext(),代码为:

public boolean hasNext() {
    return cursor ! = size;
}

cursor与size比较,比较直接,看next方法:

public E next() {
    checkForComodification();
    int i = cursor;
    if(i >= size)
        throw new NoSuchElementException();
    Object[] elementData = ArrayList.this.elementData;
    if(i >= elementData.length)
        throw new ConcurrentModificationException();
    cursor = i + 1;
    return (E) elementData[lastRet = i];
}

首先调用了checkForComodification,它的代码为:

final void checkForComodification() {
    if(modCount ! = expectedModCount)
        throw new ConcurrentModificationException();
}

所以,next前面部分主要就是在检查是否发生了结构性变化,如果没有变化,就更新cursor和lastRet的值,以保持其语义,然后返回对应的元素。remove的代码为:

public void remove() {
    if(lastRet < 0)
        throw new IllegalStateException();
    checkForComodification();
    try {
        ArrayList.this.remove(lastRet);
        cursor = lastRet;
        lastRet = -1;
        expectedModCount = modCount;
    } catch (IndexOutOfBoundsException ex) {
        throw new ConcurrentModificationException();
    }
}

它调用了ArrayList的remove方法,但同时更新了cursor、lastRet和expectedModCount的值,所以它可以正确删除。不过,需要注意的是,调用remove方法前必须先调用next,比如,通过迭代器删除所有元素,直觉上,可以这么写:

public static void removeAll(ArrayList<Integer> list){
    Iterator<Integer> it = list.iterator();
    while(it.hasNext()){
        it.remove();
    }
}

实际运行,会抛出异常java.lang.IllegalStateException,正确写法是:

public static void removeAll(ArrayList<Integer> list){
    Iterator<Integer> it = list.iterator();
    while(it.hasNext()){
        it.next();
        it.remove();
    }
}

当然,如果只是要删除所有元素,ArrayList有现成的方法clear()。

5.迭代器的好处
为什么要通过迭代器这种方式访问元素呢?直接使用size()/get(index)语法不也可以吗?在一些场景下,确实没有什么差别,两者都可以。不过,foreach语法更为简洁一些,更重要的是,迭代器语法更为通用,它适用于各种容器类。

此外,迭代器表示的是一种关注点分离的思想,将数据的实际组织方式与数据的迭代遍历相分离,是一种常见的设计模式。需要访问容器元素的代码只需要一个Iterator接口的引用,不需要关注数据的实际组织方式,可以使用一致和统一的方式进行访问。

而提供Iterator接口的代码了解数据的组织方式,可以提供高效的实现。在ArrayList中, size/get(index)语法与迭代器性能是差不多的,但在后续介绍的其他容器中,则不一定,比如LinkedList,迭代器性能就要高很多。

从封装的思路上讲,迭代器封装了各种数据组织方式的迭代操作,提供了简单和一致的接口。

ArrayList实现的接口

Java的各种容器类有一些共性的操作,这些共性以接口的方式体现,我们刚刚介绍的Iterable接口就是,此外,ArrayList还实现了三个主要的接口:Collection、List和Random-Access,我们逐个介绍。

1. Collection
Collection表示一个数据集合,数据间没有位置或顺序的概念,Java 7中的接口定义为:

public interface Collection<E> extends Iterable<E> {
    int size();
    boolean isEmpty();
    boolean contains(Object o);
    Iterator<E> iterator();
    Object[] toArray();
    <T> T[] toArray(T[] a);
    boolean add(E e);
    boolean remove(Object o);
    boolean containsAll(Collection<? > c);
    boolean addAll(Collection<? extends E> c);
    boolean removeAll(Collection<? > c);
    boolean retainAll(Collection<? > c);
    void clear();
    boolean equals(Object o);
    int hashCode();
}

这些方法中,除了两个toArray方法和几个xxxAll()方法外,其他我们已经介绍过了。toArray方法我们待会再介绍。这几个xxxAll()方法的含义基本也是可以顾名思义的, addAll表示添加,removeAll表示删除,containsAll表示检查是否包含了参数容器中的所有元素,只有全包含才返回true, retainAll表示只保留参数容器中的元素,其他元素会进行删除。Java 8对Collection接口添加了几个默认方法,包括removeIf、stream、spliterator等,具体可参见API文档。

抽象类AbstractCollection对这几个方法都提供了默认实现,实现的方式就是利用迭代器方法逐个操作。比如,我们看removeAll方法,代码为:

public boolean removeAll(Collection<? > c) {
    boolean modified = false;
    Iterator<? > it = iterator();
    while(it.hasNext()) {
        if(c.contains(it.next())) {
            it.remove();
            modified = true;
        }
    }
    return modified;
}

代码比较简单,就不解释了。ArrayList继承了AbstractList,而AbstractList又继承了AbstractCollection, ArrayList对其中一些方法进行了重写,以提供更为高效的实现,具体不再介绍。

2. List
List表示有顺序或位置的数据集合,它扩展了Collection,增加的主要方法有(Java 7):

boolean addAll(int index, Collection<? extends E> c);
E get(int index);
E set(int index, E element);
void add(int index, E element);
E remove(int index);
int indexOf(Object o);
int lastIndexOf(Object o);
ListIterator<E> listIterator();
ListIterator<E> listIterator(int index);
List<E> subList(int fromIndex, int toIndex);

这些方法都与位置有关,容易理解,就不介绍了。Java 8对List接口增加了几个默认方法,包括sort、replaceAll和spliterator; Java 9增加了多个重载的of方法,可以根据一个或多个元素生成一个不变的List,具体就不介绍了,可参看API文档。

3. RandomAccess
RandomAccess的定义为:

public interface RandomAccess {
}

没有定义任何代码。这有什么用呢?这种没有任何代码的接口在Java中被称为标记接口,用于声明类的一种属性。

这里,实现了RandomAccess接口的类表示可以随机访问,可随机访问就是具备类似数组那样的特性,数据在内存是连续存放的,根据索引值就可以直接定位到具体的元素,访问效率很高。

有没有声明RandomAccess有什么关系呢?主要用于一些通用的算法代码中,它可以根据这个声明而选择效率更高的实现。比如,Collections类中有一个方法binarySearch,在List中进行二分查找,它的实现代码就根据list是否实现了RandomAccess而采用不同的实现机制,如下所示:

public static <T>
int binarySearch(List<? extends Comparable<? super T>> list, T key) {
    if(list instanceof RandomAccess || list.size()<BINARYSEARCH_THRESHOLD)
        return Collections.indexedBinarySearch(list, key);
    else
        return Collections.iteratorBinarySearch(list, key);
}

ArrayList的其他方法

ArrayList中还有一些其他方法,包括构造方法、与数组的相互转换、容量大小控制等,我们来看下。ArrayList还有两个构造方法:

public ArrayList(int initialCapacity)
public ArrayList(Collection<? extends E> c)

第一个方法以指定的大小initialCapacity初始化内部的数组大小,代码为:

this.elementData = new Object[initialCapacity];

在事先知道元素长度的情况下,或者,预先知道长度上限的情况下,使用这个构造方法可以避免重新分配和复制数组。第二个构造方法以一个已有的Collection构建,数据会新复制一份。

ArrayList中有两个方法可以返回数组:

public Object[] toArray()
public <T> T[] toArray(T[] a)

第一个方法返回是Object数组,代码为:

public Object[] toArray() {
    return Arrays.copyOf(elementData, size);
}

第二个方法返回对应类型的数组,如果参数数组长度足以容纳所有元素,就使用该数组,否则就新建一个数组,比如:

ArrayList<Integer> intList = new ArrayList<Integer>();
intList.add(123);
intList.add(456);
intList.add(789);
Integer[] arrA = new Integer[3];
intList.toArray(arrA);
Integer[] arrB = intList.toArray(new Integer[0]);
System.out.println(Arrays.equals(arrA, arrB));

输出为true,表示两种方式都是可以的。

Arrays中有一个静态方法asList可以返回对应的List,如下所示:

Integer[] a = {1,2,3};
List<Integer> list = Arrays.asList(a);

需要注意的是,这个方法返回的List,它的实现类并不是本文介绍的ArrayList,而是Arrays类的一个内部类,在这个内部类的实现中,内部用的数组就是传入的数组,没有拷贝,也不会动态改变大小,所以对数组的修改也会反映到List中,对List调用add、remove方法会抛出异常。

要使用ArrayList完整的方法,应该新建一个ArrayList,如下所示:

List<Integer> list = new ArrayList<Integer>(Arrays.asList(a));

ArrayList还提供了两个public方法,可以控制内部使用的数组大小,一个是:

public void ensureCapacity(int minCapacity)

它可以确保数组的大小至少为minCapacity,如果不够,会进行扩展。如果已经预知ArrayList需要比较大的容量,调用这个方法可以减少ArrayList内部分配和扩展的次数。

另一个方法是:

public void trimToSize()

它会重新分配一个数组,大小刚好为实际内容的长度。调用这个方法可以节省数组占用的空间。

酷客教程相关文章:

赞(0)

评论 抢沙发

评论前必须登录!