1.7是 數(shù)組+鏈表 1.8是 數(shù)組+鏈表【超過(guò)閾值會(huì)變成紅黑樹(shù)】
如何解決Hash沖突問(wèn)題擴(kuò)容條件- 鏈表長(zhǎng)度超過(guò)8
- 元素個(gè)數(shù)超過(guò)數(shù)組個(gè)數(shù)的75%
- 鏈表長(zhǎng)度超過(guò)8
- 此時(shí)看看數(shù)組長(zhǎng)度是否超過(guò)64,超過(guò)就進(jìn)行樹(shù)化,否則只是單純擴(kuò)容
其實(shí)一般正常的元素,都是不會(huì)超過(guò)閾值的,只有插入一堆重復(fù)的元素,hash值一樣,才可能達(dá)到閾值,這個(gè)簡(jiǎn)稱Dos攻擊 而元素一旦多起來(lái),鏈表查找的效率就遠(yuǎn)不及紅黑樹(shù)了
?♂?樹(shù)化一定更好嗎?不是的,維護(hù)紅黑樹(shù)需要占用比鏈表更多的空間,而且當(dāng)鏈表長(zhǎng)度足夠短的時(shí)候,鏈表查找的效率反而比紅黑樹(shù)更高??
為什么選擇0.75和8root、root.left、root.right、root.left.left 有一個(gè)為 null ,也會(huì)退化為鏈表(看的是移除之前的情況)
為什么需要二次哈希先獲得key的hashCode的值 h,然后 h 和 h右移16位 做異或運(yùn)算。
實(shí)質(zhì)上是把一個(gè)數(shù)的末x位低16位與他的高16位做異或運(yùn)算,因?yàn)樵谇懊?(n - 1) & hash 的計(jì)算中,hash變量只有末x位會(huì)參與到運(yùn)算。使高16位也參與到hash的運(yùn)算能減少?zèng)_突
只有2的n次方,去-1,才能用 & 替代 %
為了方便擴(kuò)容擴(kuò)容時(shí)重新計(jì)算索引效率更高: hash & oldCap == 0 的元素留在原來(lái)位置 否則新位置 = 舊位置 + oldCap (oldCap:原始的容量)
因?yàn)镠ashMap的初始容量是2的次冪,擴(kuò)容之后的長(zhǎng)度是原來(lái)的二倍,新的容量也是2的次冪,所以,元素,要么在原位置,要么在原位置再移動(dòng)2的次冪。
看下這張圖,n為table的長(zhǎng)度 圖a表示擴(kuò)容前的key1和key2兩種key確定索引的位置 圖b表示擴(kuò)容后key1和key2兩種key確定索引位置。
元素在重新計(jì)算hash之后,因?yàn)閚變?yōu)?倍,那么n-1的mask范圍在高位多1bit(紅色),因此新的index就會(huì)發(fā)生這樣的變化:
所以在擴(kuò)容時(shí),只需要看原來(lái)的hash值新增的那一位是0還是1就行了【直接 hash & oldCap,就能知道是0還是1了】 是0的話索引沒(méi)變,是1的話就變成原索引+oldCap
不用2的n次方可以嗎可以的,因?yàn)?的n次方也會(huì)有缺陷,比如給定的值全是偶數(shù),無(wú)論如何hash之后取模,都是偶數(shù),分布就不均勻
注意此時(shí)如果用質(zhì)數(shù)作為容量的話,就會(huì)分布得比較均勻
二次 hash 是為了配合 容量是 2 的 n 次冪 這一設(shè)計(jì)前提,如果 hash 表的容量不是 2 的 n 次冪,則不必二次 hash
容量是 2 的 n 次冪 這一設(shè)計(jì)計(jì)算索引效率更好,但 hash 的分散性就不好,需要二次 hash 來(lái)作為補(bǔ)償,沒(méi)有采用這一設(shè)計(jì)的典型例子是 Hashtable
并發(fā)擴(kuò)容丟失數(shù)據(jù)問(wèn)題主要是第一個(gè)節(jié)點(diǎn)才會(huì)吧?因?yàn)榈谝粋€(gè)是new Node出來(lái)的
jdk1.7 并發(fā)擴(kuò)容死鏈問(wèn)題jdk1.7中,采用的是頭插法,用一個(gè)e指針表示當(dāng)前要擴(kuò)容的節(jié)點(diǎn),next表示接下來(lái)要擴(kuò)容的節(jié)點(diǎn),一直頭插e(cuò)更新e為next,直到e為null
假設(shè)現(xiàn)在有兩個(gè)線程1和2,要擴(kuò)容一個(gè)Map
- 線程1的局部變量e,指向了a節(jié)點(diǎn),next指向b節(jié)點(diǎn)
- 線程2的局部變量也是如此,此時(shí)線程2先進(jìn)行擴(kuò)容,由于是頭插法,最終結(jié)果變成了 b->a
- 但此時(shí)來(lái)到線程1先進(jìn)行,局部變量不會(huì)受改變,e還是指向a,next還是b,所以把a(bǔ)頭插,并且更新e為next,也就變成了b
- 線程1繼續(xù)頭插b,沒(méi)問(wèn)題,結(jié)果變成了[b->a],看起來(lái)是沒(méi)問(wèn)題了,但是接下來(lái)判斷e還沒(méi)有next:
- 發(fā)現(xiàn)e的next是a,又要繼續(xù)頭插a,插完a之后,發(fā)現(xiàn)a的next又是b,寄了這下,無(wú)限循環(huán)了
原文鏈接:https://juejin.cn/post/7160661444143841288