Java集合类主要由Collectiont接口和 Map接口派生。 Collection接口派生出Set、List、Queue接口。
四个接口分为四大类集合: Set表示无序集合、List有序集合、Queue先进先出队列、Map 键值对集合
这些接口常见是实现类有HashSet、TreeSet、ArrayList、 LinkedList、 ArrayDeque、HashMap、 TreeMap
安全的只有Vector、Hashtable。 比较古老、性能很差
不如用Collections工具类的synchronizedCollection()方法,把不安全的集合类包装成安全的集合类
JDK5开始引入了concurrent包,提供了大量支持高效并发访问的集合类,既能保证线程安全,又能保证良好的访问性能。
HashMap、 LinkedHashMap、TreeMap、ConcurrenHashMap
HashMap 和 LinedHashMap 键值能存 null ,其他的不行
对于不需要排序的场景,优先使用HashMap,如果需要线程安全可以用ConcurrentHashMap,其性能好于Hashtable。
对于需要记住插入顺序的场景用LinkedHashMap、对于需要Key排序的场景选中TreeMap,
如果需要线程安全也可以用Collections工具类将上述实现类包装成安全的Map
HashMap的底层数据结构是数组+链表,如果链表长度达到8,链表会转化为红黑树
底层使用Set集合存储entry
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
map的存储过程为:
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
HashMap计算Hash值不是简单的直接用Object的Hash值,而是将这个Hash值异或上它无符号右移16位 h = hahsCode() ^ (h >>>16)
也就是把HashCode的高16位移位到第位进行异或运算。这样做的原因是HashCode的差异主要再高位,而通过hash值计算索引位置时会忽略掉高位信息,所有用异或把高位信息也保存下来,减少hash碰撞
(n - 1) & hash
这么做使得计算出的索引一定在数组界限内
触发扩容的三个条件: ①数组为空、②链表长度达到8,且数组长度小于64 则扩容、 ③数组中元素超过阈值(默认0.75)则扩容
扩容过程:
B/B+树多用于外存上
HashMap本来是数组+链表的形式,链表由于其查找慢的特点,所以需要被查找效率更高的树结构来替
换。
如果用二叉树的话,极端情况二叉树只有一边子树可能会变成单链表的形状。
如果用B/B+树的话,在数据量不是很多的情况下,数据都会“挤在”一个结点里面,这个时候遍历效率就退化成了链表。
在多线程下,当重新调整HashMap的大小的时候,如果两个线程都发现要resize(), 他们同时尝试调整大小的过程中,存储在链表中的元素次序会反过来。因为迁移数据到新的位置的时候,HashMap是用的头插法,防止尾部遍历。 两个线程竞争就可能导致循环链表。
待补充