• Java中的集合框架


    目录

    集合体系

    Collection - List接口实现类

    Collection - List接口对象的遍历

    Collection - List - ArrayList

    Collection - List - Vector

    Collection - List - LinkedList

    Collection - Set接口实现类

    Collection - Set接口的遍历

    Collection - Set - HashSet

    HashSet - add源码解读

    Collection - Set - TreeSet

    Map接口实现类

    Map接口对象遍历

    Map接口实现类的特点

    Map - HashMap

    Map - Hashtable

    Map - Properties extends Hashtable

    Map - TreeMap

    Java集合框架实现类的扩容机制汇总

    Java集合框架实现类的选用规则

    Collections工具类


    集合体系

    ✍Java中应用于集合体系的接口有Collection接口的和Map两种。集合体系图如下:
     

    Collection接口下的集合为单列集合(单个对象组成的集合):

    • 实现Collection的主要子接口有List和Set两个。
      • 实现List的集合类主要有Arraylist、LinkedList、Vector
        • 实现Set接口的集合类主要有HashSet、TreeSet

    Map接口下的集合为双列集合(键值对集合):

    • 实现Map接口的集合类主要有HashMap、TreeMap、Hashtable、Properties

    ✍集合接口以及集合类之间的关系和体系图如下:

    • Collection  (Interface)
      • List   (Interface)
        • ArrayList   (class)
        • LinkedList   (class)
        • Vector   (class)
      • Set   (Interface)
        • HashSet   (class)
        • TreeSet   (class)
    • Map   (Interface)
      • HashMap   (class)
      • TreeMap   (class)
      • Hashtable   (class)
      • Properties   (class)

    Collection - List接口实现类

    Collection - List接口对象的遍历

    子接口List和Set都继承自Collection接口,因此实现上述接口的集合类对象都可以利用上象转型用Collection接口对象接收。下面是Collection接口集合对象的三种常用的遍历方法

    Iterator迭代器遍历/增强for循环遍历/普通for循环遍历(ArrayList对象为例)

    1. import java.util.ArrayList;
    2. import java.util.Iterator;
    3. public class ArrayList_ {
    4. public static void main(String[] args) {
    5. ArrayList arrayList = new ArrayList();
    6. for(int i=0;i<3;i++) {
    7. arrayList.add(i);
    8. }
    9. //Iterator迭代器遍历
    10. Iterator iterator = arrayList.iterator();
    11. while (iterator.hasNext()) {
    12. Integer next = iterator.next();
    13. System.out.println(next);
    14. }
    15. //增强for循环遍历
    16. System.out.println("===========");
    17. for (Integer integer: arrayList) {
    18. System.out.println(integer);
    19. }
    20. System.out.println("===========");
    21. //普通for循环遍历
    22. for (int i = 0; i < arrayList.size(); i++) {
    23. System.out.println(arrayList.get(i));
    24. }
    25. }
    26. }

    Collection - List - ArrayList对象

    适用及特点:

    • 适用单线程,ArrayList对象是线程不安全的,但效率高
    • 需求需要大量改查时使用,效率高
    • ArrayList对象的扩容机制
    • 添加的元素是有序的,且可以添加重复的元素

    Collection - List - Vector

    使用及特点:

    • 适用多线程,线程安全,但效率低
    • 添加的元素是有序的,且可以添加重复的元素
    • 扩容机制:
      • 使用无参构造,初始化Vector对象维护的elementData的数组大小为10,伺候按照原来的2倍进行扩容
      • 使用有参构造,初始化elementData数组的大小为参数值,此后2倍扩容。
      • 可以在构造方法使用capacityIncrement参数指定每次扩容的数量

    Collection - List - LinkedList

    使用及特点:

    • LInkedList的底层实现了双向链表和双端队列的特点
    • 可以添加任意元素包括空
    • 线程不安全,因此效率也高
    • 在需求需要进行大量的增删时使用

    Collection - Set接口实现类

    Collection - Set接口的遍历

    Set接口中的元素是无序的,因此不能通过get方法得到相应的元素。不能使用普通for循环进行遍历

    1. Iterator iterator = hashSet.iterator();
    2. //hashSet的两种遍历方式
    3. while(iterator.hasNext()) {
    4. Person s = iterator.next();
    5. System.out.println(s);
    6. }
    7. for(Person p : hashSet) {
    8. System.out.println(p);
    9. }

    Collection - Set - HashSet

    使用及特点:

    • Set接口对象的元素无序,元素添加的顺序和取出的顺序不同,所以不能通过索引的方式遍历或者获得元素,但是元素取出的顺序是固定的
    • Set接口的对象中的元素不允许重复,因此最多包含一个null,相同的元素相同时只能添加一个

    Set - HashSet的扩容机制

      使用默认无参构造器:

    • 初始化的HashSet对象维护的HashMap对象中的table数组的大小为0.
    • 向HashSet对象中添加元素时,table数组的大小被初始化为16
    • 当table数组中的元素个数达到数组大小的乘以默认加载因子LoadFactor(默认0.75)倍后,数组进行扩容,扩容的倍数为原来的两倍

      使用带有参数的构造器:

    • 初始化的HashSet对象维护的HashMap对象中的table数组的大小为0.
    • 向Hashset中添加元素时,table数组的大小被初始化为比指定的initCapacity大的最小的2的倍数的大小
      initCapacity:1,  table.length:2
      initCapacity:9,  table.length:16
    • 如果指定加载因子,则将table数组中的元素个数达到table.length * loadFactor时进行2倍扩容。

    Set接口的HashSet对象源码解读:

    • HashSet的底层是HashMap
    • 向HashSet集合中添加元素时,会通过由该元素得到的hash值转换成的索引值作为下标将数据元素存入所对应的table数组。
    • 在将数据元素存入table数组时,如果此下标处为空,则将数据元素直接加入;如果有数据元素,调用equals与以该数据元素作为头节点的链表的数据元素进行比较,如果有一个数据元素与其相同则放弃添加,如果没有与其相同的元素,则将数据元素添加至该链表的末尾。
    • 在Java8中,如果一条链表的个数超过 TREEIFY_THRESHOLD(默认为8),并且table数组的大小(包括横向和竖向添加的元素) >= MIN_TREEIFT_CAPACITY(默认为64),就会对table中的链表的头节点进行树化(红黑树)

    面试题:

    1. 1.
    2. HashSet hashSet = new HashSet();
    3. System.out.println(hashSet.add(new String("Java")));//true
    4. System.out.println(hashSet.add(new String("Java")));//false
    5. 2.
    6. HashSet personHashSet = new HashSet<>();
    7. System.out.println(personHashSet.add(new Person("LiMing",18)));//true
    8. System.out.println(personHashSet.add(new Person("LiMing",18)));//true
    • 1原因:通过new 一个相同的字符串值得到的hash值相同,从而通过处理后得到的要存入的table数组的下标也相同,又有equals在String类的内部进行了重写,在存入调用字符串的equals方法返回的结果为true,从而第二次添加失败
    • 2原因:2个Person对象为不同的对象得到的hash值也不同,直接存入不同下标的table数组中。此时即使对Person类中的hashCode方法进行重写使Person的实例化对象产生相同的hash值和相同的下标,但由于没有对Person中的equal方法进行重写,两个new出来的不同的Person对象依然会被添加进table数组中,只不过下标相同,是两个相邻的结点:

    HashSet - add源码解读

    1. //借助一个自定义Person类来追踪HashSet的源码机制
    2. //Person类具有私有的age和name属性并且覆写了equals方法和具备name和age属性的hashCode方法
    3. @Override
    4. class Person {
    5. private int age;
    6. private String name;
    7. public Person(int age,String name) {
    8. this.name = name;
    9. this.age = age;
    10. }
    11. //getter、setter略
    12. // 重写equals和hashCode方法使得出现hash冲突,将对应的数据元素链式存入相同的table数组的下表中
    13. @Override
    14. public boolean equals(Object o) {
    15. if(this == o) {
    16. return true;
    17. }
    18. if(o == null || this.getClass() != o.getClass()) {
    19. return false;
    20. }
    21. Person p = (Person) o;
    22. return this.name.equals((p.getName())) && this.age == p.getAge();
    23. }
    24. @Override
    25. public int hashCode() {
    26. return Objects.hash(age,name);
    27. }
    28. @Override
    29. public String toString() {
    30. return "Person{" +
    31. "age=" + age +
    32. ", name='" + name + '\'' +
    33. '}';
    34. }
    35. }

     Collection - Set - TreeSet

    • 对数据对象有排序需求时使用
    • TreeSet的底层时TreeMap,数据存放在Entry对象中
    • TreeSet中不能添加null,会抛出NulPointerException异常对象
    • TreeSet提供了带有Comparator比较器的接口,传入覆写过compare方法匿名内部类对象供内部使用

    例如现在需求要求将传入的字符串对象按照长度升序排列:

    1. public class TreeSet_ {
    2. public static void main(String[] args) {
    3. TreeSet treeSet = new TreeSet<>(new Comparator() {
    4. @Override
    5. public int compare(String o1, String o2) {
    6. return o1.length() - o2.length();
    7. }
    8. });
    9. treeSet.add("huawei");
    10. treeSet.add("alibabaAlipay");
    11. treeSet.add("tencent");
    12. treeSet.add("MI");
    13. treeSet.add("alibaba");
    14. System.out.println(treeSet);
    15. }
    16. }
    17. //输出:[MI, huawei, tencent, alibabaAlipay]

    但是!!!会发现"alibaba"这个字符串并没有添加进集合中,这是因为在add方法在添加对象调用compare方法的所返回的结果为0时,并没有进行传入对象的添加:

    Map接口实现类

    Map接口对象遍历

    1. //取出所有的key值遍历(keySet)
    2. Set strings = hashMap.keySet();
    3. //增强for循环
    4. for(String s : strings) {
    5. System.out.println(s + " " + hashMap.get(s));
    6. }
    7. //Iterator遍历器
    8. System.out.println("======Iterator遍历器======");
    9. Iterator iterator = strings.iterator();
    10. while(iterator.hasNext()) {
    11. String key = iterator.next();
    12. System.out.println(key + " " + hashMap.get(key));
    13. }
    14. //取出所有的value值遍历(values)
    15. Collection col = hashMap.values();
    16. //增强for和迭代器遍历
    17. for(Person p : col) {
    18. System.out.println(p);
    19. }
    20. //迭代器
    21. Iterator personIterator = col.iterator();
    22. while(personIterator.hasNext()) {
    23. System.out.println(personIterator.next());
    24. }
    25. for(int i=0;i
    26. System.out.println();
    27. }
    28. //取出所有的关系遍历
    29. Set> entries = hashMap.entrySet();
    30. for (Map.Entry stringPersonEntry : entries) {
    31. System.out.println(stringPersonEntry.getKey() + stringPersonEntry.getValue());
    32. }
    33. Iterator> iterator1 = entries.iterator();
    34. while(iterator1.hasNext()) {
    35. System.out.println(iterator1.next());
    36. }

    Map接口实现类的特点

    • Map与Collection并列存在,用于保存具有映射关系的数据(Key - Value)
    • Map中的Key和Value在不指定时可以是任何的引用数据类型,会被封装到HashMap$Node对象中
    • Map中的Key不能重复,原因和HashSet相同,但是Value可以重复
    • Map中的Key和Value都可以为空
    • 常用String类作为Map的Key值
    • Key 和 Value之间存在一 一对应关系,通过指定的key总能找到对应的Value,但是因为底层是hash表实现的,因此不保证映射的顺序
    • 当key相同value不同时,第二个value值会覆盖第一个value值
    • HashMap没有实现同步,因此是线程不安全的(无synchronized)

    Map - HashMap

    HashMap的扩容机制其实就是HashSet的扩容机制,见Collection - Set - HashSet

    HashMap在进行底层哈希表table数组中以某个节点为头结点的节点的红黑树树化时,需要满足:

    • 单条链表的长度超过8
    • table数组的长度达到64

    Map - Hashtable

    • Hashtable中的键以及值不允许出现null,会抛出NullPointerException异常
    • Hashtable是线程安全的,也因此效率较低
    • 当键相同,值不同时会发生值得替换
    • 扩容机制:
      Hashtable的底层维护了一个Hashtable$Entry类型的table数组,初始化table数组的大小为11,临界值为floor(11*0.75) = 8,当table数组的容量达到临界值时,进行原大小2倍+1的容量扩充。 

     Map - Properties extends Hashtable

    Properties常用于从.properties文件中加载数据到properties类对象进行数据的读取和修改,工作后properties文件通常作为配置文件,常用于IO流编程

    Map - TreeMap

    • TreeMap的原理和TreeSet一致
    • 在向TreeMap中添加键值时,应结合排序时比较原理注意添加的规则。
      例如添加的Key值俄日String对象,比较方法为字符串长度,这样进行添加时当Key值相同时,只会发生value值得替换而不会将新的Key值加入

    Java集合框架实现类的扩容机制汇总

    • ArrayList
      构造器初始化的elementData数组的大小为0。使用无参构造初始化的ArrayList对象中维护的elementData数组在第一次添加对象时的大小被初始化为10;使用有参构造初始化的ArrayList对象在第一次添加对象时elementData数组的大小初始化为指定值,此后按照原数组的1.5倍大小进行扩容
    • Vector
      默认无参构造器初始化的elementData数组的大小为10,也可以使用带有参数的构造器指定大小,此后进行2倍扩容。也可以使用capacityIncrement参数指定每次扩容的基数
    • HashSet/HashMap
      使用无参构造初始化的table数组的大小为0.在第一次添加数组时table数组的大小倍初始化为16.默认的加载因子为0.75.当容量达到size*loadFactor时进行2倍扩容。也可以在使用构造器时指定table数组的默认大小和加载因子
    • Hashtable
      初始化Hashtable对象中的table数组的大小为11,加载因子为0.75,当数组中的容量达到size*loadFactor时进行二倍+1的扩容

    Java集合框架实现类的选用规则

    Collections工具类