Web服務端是Java語言最擅長的領域之一,也會Java最廣泛應用的地方。而高并發高吞吐量也越來越成為服務端普遍需求,所有能夠開發出高效并發的應用程序,也是成為一個高級程序員的必備技能。下面我們將從JVM內存模型的角度來分析虛擬機如何實現多線程、多線程之間由于共享和競爭數據而導致的并發問題及解決思路。
計算機硬件內存架構
想要了解JVM內存模型,我們需要先了解下計算機的硬件內存架構
正如上圖所示,經過簡化CPU與內存操作的簡易圖,實際上沒有這么簡單,這里為了理解方便,我們省去了南北橋并將三級緩存統一為CPU緩存(有些CPU只有二級緩存,有些CPU有三級緩存)。就目前計算機而言,一般擁有多個CPU并且每個CPU可能存在多個核心,多核是指在一枚處理器(CPU)中集成兩個或多個完整的計算引擎(內核),這樣就可以支持多任務并行執行,從多線程的調度來說,每個線程都會映射到各個CPU核心中并行運行。在CPU內部有一組CPU寄存器,寄存器是CPU直接訪問和處理的數據,是一個臨時放數據的空間。一般CPU都會從內存取數據到寄存器,然后進行處理,但由于內存的處理速度遠遠低于CPU,導致CPU在處理指令時往往花費很多時間在等待內存做準備工作,于是在寄存器和主內存間添加了CPU緩存,CPU緩存比較小,但訪問速度比主內存快得多,用它來作為內存與處理器之間的緩沖:將運算需要使用到的數據復制到緩存中,讓運算能快速進行,當運算結束后再從緩存同步到內存之中,這樣處理器就不用等待緩慢的內存讀寫了。
基于高速緩存的存儲交互很好的解決了處理器與內存的速度矛盾,但也為計算機系統 帶來了更高的復雜度,因為它引入了一個新的問題:緩存一致性。在多處理器系統中,每個處理器都有自己的高速緩存,而它們又共享同一主內存(RAM)。當多個處理器的運算任務都涉及同一塊主內存區域時,將可能導致各自的緩存數據不一致,為了解決一致性問題,需要各個處理器訪問緩存時都遵循一些協議,在讀寫時根據協議來進行操作,這些協議有MSI、MESI、MOSI等。被稱為硬件的“內存模型”,可以理解為在特定的操作協議下,對特定的內存或高速緩存進行讀寫訪問的過程抽象。不同架構的物理機器可以擁有不一樣的內存模型,而我們的JAVA虛擬機也有自己的內存模型。
Java線程與硬件處理器
了解完硬件的內存架構后,接著了解JVM中線程的實現原理,理解線程的實現原理,有助于我們了解Java內存模型與硬件內存架構的關系,在Window系統和Linux系統上,Java線程的實現是基于一對一的線程模型,所謂的一對一模型,實際上就是通過語言級別層面程序去間接調用系統內核的線程模型,即我們在使用Java線程時,Java虛擬機內部是轉而調用當前操作系統的內核線程來完成當前任務。這里需要了解一個術語,內核線程(Kernel-Level Thread,KLT),它是由操作系統內核(Kernel)支持的線程,這種線程是由操作系統內核來完成線程切換,內核通過操作調度器進而對線程執行調度,并將線程的任務映射到各個處理器上。每個內核線程可以視為內核的一個分身,這也就是操作系統可以同時處理多任務的原因。由于我們編寫的多線程程序屬于語言層面的,程序一般不會直接去調用內核線程,取而代之的是一種輕量級的進程(Light Weight Process),也是通常意義上的線程,由于每個輕量級進程都會映射到一個內核線程,因此我們可以通過輕量級進程調用內核線程,進而由操作系統內核將任務映射到各個處理器,這種輕量級進程與內核線程間1對1的關系就稱為一對一的線程模型。
Java內存模型
內存模型概述
Java內存模型(即Java Memory Model,簡稱JMM)本身是一種抽象的概念,并不真實存在,它描述的是一組規則或規范,通過這組規范定義了程序中各個變量(包括實例字段,靜態字段和構成數組對象的元素)的訪問方式。
Java內存模型的主要目標是定義程序中的各個變量的訪問規則,即如何在虛擬機中將變量存儲到內存和從內存中取出。此處的變量不包括局部變量和方法參數,因為它們是線程私有的,不會被共享,自然不存在競爭問題。由于JVM運行程序的實體是線程,而每個線程創建時JVM都會為其創建一個工作內存(有些地方稱為棧空間),用于存儲線程私有的數據,而Java內存模型中規定所有變量都存儲在主內存,主內存是共享內存區域,所有線程都可以訪問,但線程對變量的操作(讀取賦值等)必須在工作內存中進行,首先要將變量從主內存拷貝的自己的工作內存空間,然后對變量進行操作,操作完成后再將變量寫回主內存,不能直接操作主內存中的變量,工作內存中存儲著主內存中的變量副本拷貝,前面說過,工作內存是每個線程的私有數據區域,因此不同的線程間無法訪問對方的工作內存,線程間的通信(傳值)必須通過主內存來完成,線程、主內存、工作內存三者的關系如下圖
弄清楚主內存和工作內存后,接了解一下主內存與工作內存的數據存儲類型以及操作方式,根據虛擬機規范,對于一個實例對象中的成員方法而言,如果方法中包含本地變量是基本數據類型(boolean,byte,short,char,int,long,float,double),將直接存儲在工作內存的幀棧結構中,但倘若本地變量是引用類型,那么該變量的引用會存儲在功能內存的幀棧中,而對象實例將存儲在主內存(共享數據區域,堆)中。但對于實例對象的成員變量,不管它是基本數據類型或者包裝類型(Integer、Double等)還是引用類型,都會被存儲到堆區。至于static變量以及類本身相關信息將會存儲在主內存中。需要注意的是,在主內存中的實例對象可以被多線程共享,倘若兩個線程同時調用了同一個對象的同一個方法,那么兩條線程會將要操作的數據拷貝一份到自己的工作內存中,執行完成操作后才刷新到主內存。
JAVA內存模型與JAVA內存區域關系
這里需要注意下JAVA內存模型中的主內存、工作內存與JAVA內存區域中的JAVA堆、棧、方法區不是同一層次的內存劃分,不要混淆。
JAVA內存模型
·主內存
主要存儲的是Java實例對象,所有線程創建的實例對象都存放在主內存中,不管該實例對象是成員變量還是方法中的本地變量(也稱局部變量),當然也包括了共享的類信息、常量、靜態變量。由于是共享數據區域,多條線程對同一個變量進行訪問可能會發現線程安全問題。
·工作內存
主要存儲當前方法的所有本地變量信息(工作內存中存儲著主內存中的變量副本拷貝),每個線程只能訪問自己的工作內存,即線程中的本地變量對其它線程是不可見的,就算是兩個線程執行的是同一段代碼,它們也會各自在自己的工作內存中創建屬于當前線程的本地變量,當然也包括了字節碼行號指示器、相關Native方法的信息。注意由于
工作內存是每個線程的私有數據,線程間無法相互訪問工作內存,因此存儲在工作內存的數據不存在線程安全問題。
Java內存區域
·方法區(Method Area)
方法區屬于線程共享的內存區域,又稱Non-Heap(非堆),主要用于存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯后的代碼等數據,根據Java 虛擬機規范的規定,當方法區無法滿足內存分配需求時,將拋出OutOfMemoryError 異常。值得注意的是在方法區中存在一個叫運行時常量池(Runtime Constant Pool)的區域,它主要用于存放編譯器生成的各種字面量和符號引用,這些內容將在類加載后存放到運行時常量池中,以便后續使用。
·JVM堆(Java Heap)
Java 堆也是屬于線程共享的內存區域,它在虛擬機啟動時創建,是Java 虛擬機所管理的內存中最大的一塊,主要用于存放對象實例,幾乎所有的對象實例都在這里分配內存,注意Java 堆是垃圾收集器管理的主要區域,因此很多時候也被稱做GC 堆,如果在堆中沒有內存完成實例分配,并且堆也無法再擴展時,將會拋出OutOfMemoryError異常。
·程序計數器(Program Counter Register)
屬于線程私有的數據區域,是一小塊內存空間,主要代表當前線程所執行的字節碼行號指示器。字節碼解釋器工作時,通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
·虛擬機棧(Java Virtual Machine Stacks)
屬于線程私有的數據區域,與線程同時創建,總數與線程關聯,代表Java方法執行的內存模型。每個方法執行時都會創建一個棧楨來存儲方法的的變量表、操作數棧、動態鏈接方法、返回值、返回地址等信息。每個方法從調用直結束就對于一個棧楨在虛擬機棧中的入棧和出棧過程。
·本地方法棧(Native Method Stacks)
本地方法棧屬于線程私有的數據區域,這部分主要與虛擬機用到的 Native 方法相關,一般情況下,我們無需關心此區域。
Java內存模型與硬件內存架構的關系
通過對前面的硬件內存架構、Java內存模型以及Java多線程的實現原理的了解,我們應該已經意識到,多線程的執行最終都會映射到硬件處理器上進行執行,但Java內存模型和硬件內存架構并不完全一致。對于硬件內存來說只有寄存器、緩存內存、主內存的概念,并沒有工作內存(線程私有數據區域)和主內存(堆內存)之分,也就是說Java內存模型對內存的劃分對硬件內存并沒有任何影響,因為JMM只是一種抽象的概念,是一組規則,并不實際存在,不管是工作內存的數據還是主內存的數據,對于計算機硬件來說都會存儲在計算機主內存中,當然也有可能存儲到CPU緩存或者寄存器中,因此總體上來說,Java內存模型和計算機硬件內存架構是一個相互交叉的關系,是一種抽象概念劃分與真實物理硬件的交叉。(注意對于Java內存區域劃分也是同樣的道理)
JMM存在的必要性
在明白了Java內存區域劃分、硬件內存架構、Java多線程的實現原理與Java內存模型的具體關系后,接著來談談Java內存模型存在的必要 性。由于JVM運行程序的實體是線程,而每個線程創建時JVM都會為其創建一個工作內存(有些地方稱為??臻g),用于存儲線程私有的數據,線程與主內存中 的變量操作必須通過工作內存間接完成,主要過程是將變量從主內存拷貝的每個線程各自的工作內存空間,然后對變量進行操作,操作完成后再將變量寫回主內存, 如果存在兩個線程同時對一個主內存中的實例對象的變量進行操作就有可能誘發線程安全問題。
如下圖,主內存中存在一個共享變量x,現在有A和B兩條線程分別對該變量x=1進行操作,A/B線程各自的工作內存中存在共享變量副本x。假設現在A線程想要修改x的值為2,而B線程卻想要讀取x的值,那么B線程讀取 到的值是A線程更新后的值2還是更新前的值1呢?答案是,不確定,即B線程有可能讀取到A線程更新前的值1,也有可能讀取到A線程更新后的值2,這是因為 工作內存是每個線程私有的數據區域,而線程A變量x時,首先是將變量從主內存拷貝到A線程的工作內存中,然后對變量進行操作,操作完成后再將變量x寫回主 內,而對于B線程的也是類似的,這樣就有可能造成主內存與工作內存間數據存在一致性問題,假如A線程修改完后正在將數據寫回主內存,而B線程此時正在讀取 主內存,即將x=1拷貝到自己的工作內存中,這樣B線程讀取到的值就是x=1,但如果A線程已將x=2寫回主內存后,B線程才開始讀取的話,那么此時B線 程讀取到的就是x=2,但到底是哪種情況先發生呢?這是不確定的,這也就是所謂的線程安全問題。
為了解決類似上述的問題,JVM定義了一組規則,通過這組規則來決定一個線程對共享變量的寫入何時對另一個線程可見,這組規則也稱為Java內存模型(即JMM),JMM是圍繞著程序執行的原子性、有序性、可見性展開的,下面我們看看這三個特性。
內存間交互操作
關于主內存與工作內存之間具體的交互協議,即一個變量如何從主內存拷貝到工作內 存、如何從工作內存同步回主內存之類的實現細節,Java內存模型中定義了以下8種操作來完成,虛擬機實現時必須保證下面提及的每一種操作都是原子的、不可再分的。lock(鎖定):作用于主內存的變量,它把一個變量標識為一條線程獨占的狀態。
unlock(解鎖):作用于主內存的變量,它把一個處于鎖定狀態的變量釋放出來,釋放后的變量才可以被其他線程鎖定。
read(讀?。鹤饔糜谥鲀却娴淖兞?,它把一個變量的值從主內存傳輸到線程的工作內存中,以便隨后的load動作使用。
load(載入):作用于工作內存的變量,它把read操作從主內存中得到的變量值放入工作內存的變量副本中。
use(使用):作用于工作內存的變量,它把工作內存中一個變量的值傳遞給執行引擎,每當虛擬機遇到一個需要使用到變量的值的字節碼指令時將會執行這個操作。
assign(賦值):作用于工作內存的變量,它把一個從執行引擎接收到的值賦給工作內存的變量,每當虛擬機遇到一個給變量賦值的字節碼指令時執行這個操作。
store(存儲):作用于工作內存的變量,它把工作內存中一個變量的值傳送到主內存中,以便隨后的write操作使用。
write(寫入):作用于主內存的變量,它把store操作從工作內存中得到的變量的值放入主內存的變量中。
如果要把一個變量從主內存復制到工作內存,那就要順序地執行read和load操作,如果要把變量從工作內存同步回主內存,就要順序地執行store和write操作。注意,Java內存模型只要求上述兩個操作必須按順序執行,而沒有保證是連續執行。也就是說,read與load之間、store與write之間是可插入其他指令的,如對主內存中的變量a、b進行訪問時,一種可能出現順序是read a、read b、load b、load a。除此之外,Java內存模型還規定了在執行上述8種基本操作時必須滿足如下規則:
·不允許read和load、store和write操作之一單獨出現,即不允許一個變量從主內存讀取了但工作內存不接受,或者從工作內存發起回寫了但主內存不接受的情況出現。
·不允許一個線程丟棄它的最近的assign操作,即變量在工作內存中改變了之后必須把該變化同步回主內存。
·不允許一個線程無原因地(沒有發生過任何assign操作)把數據從線程的工作內存同步回主內存中。
·一個新的變量只能在主內存中“誕生”,不允許在工作內存中直接使用一個未被初始化(load或assign)的變量,換句話說,就是對一個變量實施use、store操作之前,必須先執行過了assign和load操作。
·一個變量在同一個時刻只允許一條線程對其進行lock操作,但lock操作可以被同一條線程重復執行多次,多次執行lock后,只有執行相同次數的unlock操作,變量才會被解鎖。
·如果對一個變量執行lock操作,那將會清空工作內存中此變量的值,在執行引擎使用這個變量前,需要重新執行load或assign操作初始化變量的值
·如果一個變量事先沒有被lock操作鎖定,那就不允許對它執行unlock操作,也不允許去unlock一個被其他線程鎖定住的變量。
·對一個變量執行unlock操作之前,必須先把此變量同步回主內存中(執行store、write操作)。
這8種內存訪問操作以及上述規則限定,再加上稍后介紹的對volatile的一些特殊規定,就已經完全確定了Java程序中哪些內存訪問操作在并發下是安全的。由于這種定義相當嚴謹但又十分煩瑣,實踐起來很麻煩,所以在12.3.6節中筆者將介紹這種定義的一個等效判斷原則——先行發生原則,用來確定一個訪問在并發環境下是否安全。
原子性、可見性與有序性
原子性
原子性指的是一個操作是不可中斷的,即使是在多線程環境下,一個操作一旦開始就不會被其他線程影響。由Java內存模型來直接保證的原子性變量操作包括read、load、assign、use、store和write,我們大致可以認為基本數據類型的訪問讀寫是具備原子性的,但是對于64位的數據類型(long和double),在模型中特別定義了一條相對寬松的規定:允許虛擬機將沒有被volatile修飾的64位數據的讀寫操作劃分為兩次32位的操作來進行,這樣會導致一個線程在寫時,操作完前32位的原子操作后,輪到B線程讀取時,恰好只讀取到了后32位的數據,這樣可能會讀取到一個既非原值又不是線程修改值的變量,它可能是“半個變量”的數值,即64位數據被兩個線程分成了兩次讀取。但也不必太擔心,因為讀取到“半個變量”的情況比較少 見,至少在目前的商用的虛擬機中,幾乎都把64位的數據的讀寫操作作為原子操作來執行,因此對于這個問題不必太在意,知道這么回事即可。
如果應用場景需要一個更大范圍的原子性保證(經常會遇到),Java內存模型還提供了lock和unlock操作來滿足這種需求,盡管虛擬機未把lock和unlock操作直接開放給用戶使用,但是卻提供了更高層次的字節碼指令monitorenter和monitorexit來隱式地使用這兩個操作,這兩個字節碼指令反映到Java代碼中就是同步塊——synchronized關鍵字,因此在synchronized塊之間的操作也具備原子性。
可見性
可見性是指當一個線程修改了共享變量的值,其他線程能夠立即得知這個修改。對于串行程序來說,可見性問題是不存在的,因為我們在任何一個操作中修改了某個變量的值,后續的操作中都能讀取這個變量值,并且是修改過的新值。但在多線程環境中可就不一定了, 前面我們分析過,由于線程對共享變量的操作都是線程拷貝到各自的工作內存進行操作后才寫回到主內存中的,這就可能存在一個線程A修改了共享變量x的值,還未寫回主內存時,另外一個線程B又對主內存中同一個共享變量x進行操作,但此時A線程工作內存中共享變量x對線程B來說并不可見,這種工作內存與主內存同步延遲現象就會造成可見性問題。
有序性
有序性是指對于單線程的執行代碼,我們總是認為代碼的執行是按順序依次執行的,這樣的理解并沒有毛病,畢竟對于單線程而言確實如此,但對于多線程環境,則可能出現亂序現象,因為程序編譯成機器碼指令后可能會出現指令重排現象,重排后的指令與原指令的順序未必一致,要明白的是,在Java程序中,倘若在本線程內,所有操作都視為有序行為,如果是多線程環境下,一個線程中觀察另外一個線程,所有操作都是無序的,前半句指的是單線程內保證串行語義執行的一 致性,后半句則指指令重排現象和工作內存與主內存同步延遲現象。
JMM提供的解決方案
在理解了原子性,可見性以及有序性問題后,看看JMM是如何保證的,在Java內存模型中都提供一套解決方案供Java工程師在開發過程使用,如原子性問題,除了JVM自身提供的對基本數據類型讀寫操作的原子性外,對于方法級別或者代碼塊級別的原子性操作,可以使用synchronized關鍵字或 者重入鎖(ReentrantLock)保證程序執行的原子性。 而工作內存與主內存同步延遲現象導致的可見性問題,可以使用synchronized關鍵字或者volatile關鍵字解決,它們都可以使一個線程修改后 的變量立即對其他線程可見。對于指令重排導致的可見性問題和有序性問題,則可以利用volatile關鍵字解決,因為volatile的另外一個作用就是 禁止重排序優化,關于volatile稍后會進一步分析。除了靠sychronized和volatile關鍵字來保證原子性、可見性以及有序性外,JMM內部還定義一套happens-before原則來保證多線程環境下兩個操作間的原子性、可見性以及有序性。推薦了解黑馬程序員java培訓課程。
volatile內存語義
volatile是Java虛擬機提供的輕量級的同步機制。volatile關鍵字有如下三個作用:
·在工作內存中,每次使用volatile修飾的變量前都必須先從主內存刷新最新的值,用于保證能看見其他線程對volatile修飾的變量所做的修改后的值
·要求在工作內存中,每次修改volatile修飾的變量后都必須立刻同步回主內存中,用于保證其他線程可以看到自己對volatile修飾的變量所做的修改
·要求volatile修飾的變量不會被指令重排序優化,保證代碼的執行順序與程序的順序相同
先行發生原則
倘若在程序開發中,僅靠sychronized和volatile關鍵字來保證原子性、可見性以及有序性,那么編寫并發程序可能會顯得十分麻煩,幸 運的是,在Java內存模型中,還提供了happens-before 原則來輔助保證程序執行的原子性、可見性以及有序性的問題,它是判斷數據是否存在競爭、線程是否安全的依據,happens-before 原則內容如下
程序順序原則,即在一個線程內必須保證語義串行性,也就是說按照代碼順序執行。
(1)鎖規則:解鎖(unlock)操作必然發生在后續的同一個鎖的加鎖(lock)之前,也就是說,如果對于一個鎖解鎖后,再加鎖,那么加鎖的動作必須在解鎖動作之后(同一個鎖)。
(2)volatile規則:volatile變量的寫,先發生于讀,這保證了volatile變量的可見性,簡單的理解就是,volatile變量在每次被線程訪問時,都強迫從主內 存中讀該變量的值,而當該變量發生變化時,又會強迫將最新
的值刷新到主內存,任何時刻,不同的線程總是能夠看到該變量的最新值。
(3)線程啟動規則:線程的start()方法先于它的每一個動作,即如果線程A在執行線程B的start方法之前修改了共享變量的值,那么當線程B執行start方法時,線程A對共享變量的修改對線程B可見
(4)傳遞性:A先于B ,B先于C 那么A必然先于C
(5)線程終止規則 線程的所有操作先于線程的終結,Thread.join()方法的作用是等待當前執行的線程終止。
(6)在線程B終止之前,修改了共享變量,線程A從線程B的join方法成功返回后,線程B對共享變量的修改將對線程A可見。
(7)線程中斷規則:對線程 interrupt()方法的調用先行發生于被中斷線程的代碼檢測到中斷事件的發生,可以通過Thread.interrupted()方法檢測線程是否中斷。
(8)對象終結規則:對象的構造函數執行,結束先于finalize()方法
上述8條原則無需手動添加任何同步手段(synchronized|volatile)即可達到效果,下面我們結合前面的案例演示這8條原則如何判斷線程是否安全,如下:
class MixedOrder{
int a = 0;
boolean flag = false;
public void writer(){
a = 1;
flag = true;
}
public void read(){
if(flag){
int i = a + 1;
}
}
}
同樣的道理,存在兩條線程A和B,線程A調用實例對象的writer()方法,而線程B調用實例對象的read()方法,線程A先啟動而線程B后啟動,那么線程B讀取到的i值是多少呢?現在依據8條原則,由于存在兩條線程同時調用,因此程序次序原則不合適。writer()方法和read()方法都沒有使用同步手段,鎖規則也不合適。沒有使用volatile關鍵字,volatile變量原則不適應。線程啟動規則、線程終止規則、線程中斷規則、對象結規則、傳遞性和本次測試案例也不合適。線程A和線程B的啟動時間雖然有先后,但線程B執行結果卻是不確定,也是說上述代碼沒有適合8條原則中的任意一,也沒有使用任何同步手段,所以上述的操作是線程不安全的,因此線程B讀取的值自然也是不確定的。修復這個問題的方式很簡單,要么給writer()方 法和read()方法添加同步手段,如synchronized或者給變量flag添加volatile關鍵字,確保線程A修改的值對線程B總是可見。
時間先后順序與先行發生原則之間基本沒有太大的關系,所以我們衡量并發安全問題的時候不要受到時間順序的干擾,一切必須以先行發生原則為準。
猜你喜歡: