前言如果在文中用詞或者理解方面出現問題,歡迎指出。此文旨在提及而不深究,但會盡量效率地把知識點都拋出來 一、JVM的基本介紹JVM 是 Java Virtual Machine 的縮寫,它是一個虛構出來的計算機,一種規范。通過在實際的計算機上仿真模擬各類計算機功能實現··· 好,其實拋開這么專業的句子不說,就知道JVM其實就類似于一臺小電腦運行在windows或者linux這些操作系統環境下即可。它直接和操作系統進行交互,與硬件不直接交互,可操作系統可以幫我們完成和硬件進行交互的工作。 1.1 Java文件是如何被運行的比如我們現在寫了一個 HelloWorld.java 好了,那這個 HelloWorld.java 拋開所有東西不談,那是不是就類似于一個文本文件,只是這個文本文件它寫的都是英文,而且有一定的縮進而已。 那我們的 JVM 是不認識文本文件的,所以它需要一個 編譯 ,讓其成為一個它會讀二進制文件的 HelloWorld.class ① 類加載器如果 JVM 想要執行這個 .class 文件,我們需要將其裝進一個 類加載器 中,它就像一個搬運工一樣,會把所有的 .class 文件全部搬進JVM里面來。 ② 方法區方法區 是用于存放類似于元數據信息方面的數據的,比如類信息,常量,靜態變量,編譯后代碼···等 類加載器將 .class 文件搬過來就是先丟到這一塊上 ③ 堆堆 主要放了一些存儲的數據,比如對象實例,數組···等,它和方法區都同屬于 線程共享區域 。也就是說它們都是 線程不安全 的 ④ 棧棧 這是我們的代碼運行空間。我們編寫的每一個方法都會放到 棧 里面運行。 我們會聽說過 本地方法棧 或者 本地方法接口 這兩個名詞,不過我們基本不會涉及這兩塊的內容,它倆底層是使用C來進行工作的,和Java沒有太大的關系。 ⑤ 程序計數器主要就是完成一個加載工作,類似于一個指針一樣的,指向下一行我們需要執行的代碼。和棧一樣,都是 線程獨享 的,就是說每一個線程都會有自己對應的一塊區域而不會存在并發和多線程的問題。 小總結
1.2 簡單的代碼例子一個簡單的學生類 一個main方法 執行main方法的步驟如下:
其實也不用管太多,只需要知道對象實例初始化時會去方法區中找類信息,完成后再到棧那里去運行方法。找方法就在方法表中找。 二、類加載器的介紹之前也提到了它是負責加載.class文件的,它們在文件開頭會有特定的文件標示,將class文件字節碼內容加載到內存中,并將這些內容轉換成方法區中的運行時數據結構,并且ClassLoader只負責class文件的加載,而是否能夠運行則由 Execution Engine 來決定 2.1 類加載器的流程從類被加載到虛擬機內存中開始,到釋放內存總共有7個步驟:加載,驗證,準備,解析,初始化,使用,卸載。其中驗證,準備,解析三個部分統稱為連接 2.1.1 加載
2.1.2 連接
2.1.3 初始化初始化其實就是一個賦值的操作,它會執行一個類構造器的()方法。由編譯器自動收集類中所有變量的賦值動作,此時準備階段時的那個 static int a = 3 的例子,在這個時候就正式賦值為3 2.1.4 卸載GC將無用對象從內存中卸載 2.2 類加載器的加載順序加載一個Class類的順序也是有優先級的,類加載器從最底層開始往上的順序是這樣的
2.3 雙親委派機制當一個類收到了加載請求時,它是不會先自己去嘗試加載的,而是委派給父類去完成,比如我現在要new一個Person,這個Person是我們自定義的類,如果我們要加載它,就會先委派App ClassLoader,只有當父類加載器都反饋自己無法完成這個請求(也就是父類加載器都沒有找到加載所需的Class)時,子類加載器才會自行嘗試加載 這樣做的好處是,加載位于rt.jar包中的類時不管是哪個加載器加載,最終都會委托到BootStrap ClassLoader進行加載,這樣保證了使用不同的類加載器得到的都是同一個結果。 其實這個也是一個隔離的作用,避免了我們的代碼影響了JDK的代碼,比如我現在要來一個 public class String(){ public static void main(){sout;} } 這種時候,我們的代碼肯定會報錯,因為在加載的時候其實是找到了rt.jar中的String.class,然后發現這也沒有main方法 三、運行時數據區3.1 本地方法棧和程序計數器比如說我們現在點開Thread類的源碼,會看到它的start0方法帶有一個native關鍵字修飾,而且不存在方法體,這種用native修飾的方法就是本地方法,這是使用C來實現的,然后一般這些方法都會放到一個叫做本地方法棧的區域。 程序計數器其實就是一個指針,它指向了我們程序中下一句需要執行的指令,它也是內存區域中唯一一個不會出現OutOfMemoryError的區域,而且占用內存空間小到基本可以忽略不計。這個內存僅代表當前線程所執行的字節碼的行號指示器,字節碼解析器通過改變這個計數器的值選取下一條需要執行的字節碼指令。 如果執行的是native方法,那這個指針就不工作了。 3.2 方法區方法區主要的作用技術存放類的元數據信息,常量和靜態變量···等。當它存儲的信息過大時,會在無法滿足內存分配時報錯。 3.3 虛擬機棧和虛擬機堆一句話便是:棧管運行,堆管存儲。則虛擬機棧負責運行代碼,而虛擬機堆負責存儲數據。 3.3.1 虛擬機棧的概念它是Java方法執行的內存模型。里面會對局部變量,動態鏈表,方法出口,棧的操作(入棧和出棧)進行存儲,且線程獨享。同時如果我們聽到局部變量表,那也是在說虛擬機棧 public class Person{ int a = 1; public void doSomething(){ int b = 2; } } 3.3.2 虛擬機棧存在的異常如果線程請求的棧的深度大于虛擬機棧的最大深度,就會報 StackOverflowError (這種錯誤經常出現在遞歸中)。Java虛擬機也可以動態擴展,但隨著擴展會不斷地申請內存,當無法申請足夠內存時就會報錯 OutOfMemoryError。 3.3.3 虛擬機棧的生命周期對于棧來說,不存在垃圾回收。只要程序運行結束,棧的空間自然就會釋放了。棧的生命周期和所處的線程是一致的。 這里補充一句:8種基本類型的變量+對象的引用變量+實例方法都是在棧里面分配內存。 3.3.4 虛擬機棧的執行我們經常說的棧幀數據,說白了在JVM中叫棧幀,放到Java中其實就是方法,它也是存放在棧中的。 棧中的數據都是以棧幀的格式存在,它是一個關于方法和運行期數據的數據集。比如我們執行一個方法a,就會對應產生一個棧幀A1,然后A1會被壓入棧中。同理方法b會有一個B1,方法c會有一個C1,等到這個線程執行完畢后,棧會先彈出C1,后B1,A1。它是一個先進后出,后進先出原則。 3.3.5 局部變量的復用局部變量表用于存放方法參數和方法內部所定義的局部變量。它的容量是以Slot為最小單位,一個slot可以存放32位以內的數據類型。 虛擬機通過索引定位的方式使用局部變量表,范圍為[0,局部變量表的slot的數量]。方法中的參數就會按一定順序排列在這個局部變量表中,至于怎么排的我們可以先不關心。而為了節省棧幀空間,這些slot是可以復用的,當方法執行位置超過了某個變量,那么這個變量的slot可以被其它變量復用。當然如果需要復用,那我們的垃圾回收自然就不會去動這些內存。 3.3.6 虛擬機堆的概念JVM內存會劃分為堆內存和非堆內存,堆內存中也會劃分為年輕代和老年代,而非堆內存則為永久代。年輕代又會分為Eden和Survivor區。Survivor也會分為FromPlace和ToPlace,toPlace的survivor區域是空的。Eden,FromPlace和ToPlace的默認占比為 8:1:1。當然這個東西其實也可以通過一個 -XX:+UsePSAdaptiveSurvivorSizePolicy 參數來根據生成對象的速率動態調整 堆內存中存放的是對象,垃圾收集就是收集這些對象然后交給GC算法進行回收。非堆內存其實我們已經說過了,就是方法區。在1.8中已經移除永久代,替代品是一個元空間(MetaSpace),最大區別是metaSpace是不存在于JVM中的,它使用的是本地內存。并有兩個參數 MetaspaceSize:初始化元空間大小,控制發生GC MaxMetaspaceSize:限制元空間大小上限,防止占用過多物理內存。 移除的原因可以大致了解一下:融合HotSpot JVM和JRockit VM而做出的改變,因為JRockit是沒有永久代的,不過這也間接性地解決了永久代的OOM問題。 3.3.7 Eden年輕代的介紹當我們new一個對象后,會先放到Eden劃分出來的一塊作為存儲空間的內存,但是我們知道對堆內存是線程共享的,所以有可能會出現兩個對象共用一個內存的情況。這里JVM的處理是每個線程都會預先申請好一塊連續的內存空間并規定了對象存放的位置,而如果空間不足會再申請多塊內存空間。這個操作我們會稱作TLAB,有興趣可以了解一下。 當Eden空間滿了之后,會觸發一個叫做Minor GC(就是一個發生在年輕代的GC)的操作,存活下來的對象移動到Survivor0區。Survivor0區滿后觸發 Minor GC,就會將存活對象移動到Survivor1區,此時還會把from和to兩個指針交換,這樣保證了一段時間內總有一個survivor區為空且to所指向的survivor區為空。經過多次的 Minor GC后仍然存活的對象(這里的存活判斷是15次,對應到虛擬機參數為 -XX:MaxTenuringThreshold 。為什么是15,因為HotSpot會在對象投中的標記字段里記錄年齡,分配到的空間僅有4位,所以最多只能記錄到15)會移動到老年代。老年代是存儲長期存活的對象的,占滿時就會觸發我們最常聽說的Full GC,期間會停止所有線程等待GC的完成。所以對于響應要求高的應用應該盡量去減少發生Full GC從而避免響應超時的問題。 而且當老年區執行了full gc之后仍然無法進行對象保存的操作,就會產生OOM,這時候就是虛擬機中的堆內存不足,原因可能會是堆內存設置的大小過小,這個可以通過參數-Xms、-Xmx來調整。也可能是代碼中創建的對象大且多,而且它們一直在被引用從而長時間垃圾收集無法收集它們。 3.3.8 如何判斷一個對象需要被干掉圖中程序計數器、虛擬機棧、本地方法棧,3個區域隨著線程的生存而生存的。內存分配和回收都是確定的。隨著線程的結束內存自然就被回收了,因此不需要考慮垃圾回收的問題。而Java堆和方法區則不一樣,各線程共享,內存的分配和回收都是動態的。因此垃圾收集器所關注的都是堆和方法這部分內存。 在進行回收前就要判斷哪些對象還存活,哪些已經死去。下面介紹兩個基礎的計算方法 1.引用計數器計算:給對象添加一個引用計數器,每次引用這個對象時計數器加一,引用失效時減一,計數器等于0時就是不會再次使用的。不過這個方法有一種情況就是出現對象的循環引用時GC沒法回收。 2.可達性分析計算:這是一種類似于二叉樹的實現,將一系列的GC ROOTS作為起始的存活對象集,從這個節點往下搜索,搜索所走過的路徑成為引用鏈,把能被該集合引用到的對象加入到集合中。搜索當一個對象到GC Roots沒有使用任何引用鏈時,則說明該對象是不可用的。主流的商用程序語言,例如Java,C#等都是靠這招去判定對象是否存活的。 (了解一下即可)在Java語言匯總能作為GC Roots的對象分為以下幾種:
這種方法的優點是能夠解決循環引用的問題,可它的實現需要耗費大量資源和時間,也需要GC(它的分析過程引用關系不能發生變化,所以需要停止所有進程) 3.3.9 如何宣告一個對象的真正死亡首先必須要提到的是一個名叫 finalize() 的方法 finalize()是Object類的一個方法、一個對象的finalize()方法只會被系統自動調用一次,經過finalize()方法逃脫死亡的對象,第二次不會再調用。 補充一句:并不提倡在程序中調用finalize()來進行自救。建議忘掉Java程序中該方法的存在。因為它執行的時間不確定,甚至是否被執行也不確定(Java程序的不正常退出),而且運行代價高昂,無法保證各個對象的調用順序(甚至有不同線程中調用)。在Java9中已經被標記為 deprecated ,且java.lang.ref.Cleaner(也就是強、軟、弱、幻象引用的那一套)中已經逐步替換掉它,會比finalize來的更加的輕量及可靠。 判斷一個對象的死亡至少需要兩次標記
如果確定對象已經死亡,我們又該如何回收這些垃圾呢 3.4 垃圾回收算法不會非常詳細的展開,常用的有標記清除,復制,標記整理和分代收集算法 3.4.1 標記清除算法標記清除算法就是分為“標記”和“清除”兩個階段。標記出所有需要回收的對象,標記結束后統一回收。這個套路很簡單,也存在不足,后續的算法都是根據這個基礎來加以改進的。 其實它就是把已死亡的對象標記為空閑內存,然后記錄在一個空閑列表中,當我們需要new一個對象時,內存管理模塊會從空閑列表中尋找空閑的內存來分給新的對象。 不足的方面就是標記和清除的效率比較低下。且這種做法會讓內存中的碎片非常多。這個導致了如果我們需要使用到較大的內存塊時,無法分配到足夠的連續內存。比如下圖 此時可使用的內存塊都是零零散散的,導致了剛剛提到的大內存對象問題 3.4.2 復制算法為了解決效率問題,復制算法就出現了。它將可用內存按容量劃分成兩等分,每次只使用其中的一塊。和survivor一樣也是用from和to兩個指針這樣的玩法。fromPlace存滿了,就把存活的對象copy到另一塊toPlace上,然后交換指針的內容。這樣就解決了碎片的問題。 這個算法的代價就是把內存縮水了,這樣堆內存的使用效率就會變得十分低下了 不過它們分配的時候也不是按照1:1這樣進行分配的,就類似于Eden和Survivor也不是等價分配是一個道理。 3.4.3 標記整理算法復制算法在對象存活率高的時候會有一定的效率問題,標記過程仍然與“標記-清除”算法一樣,但后續步驟不是直接對可回收對象進行清理,而是讓所有存活的對象都向一端移動,然后直接清理掉邊界以外的內存 3.4.4 分代收集算法這種算法并沒有什么新的思想,只是根據對象存活周期的不同將內存劃分為幾塊。一般是把Java堆分為新生代和老年代,這樣就可以根據各個年代的特點采用最適當的收集算法。在新生代中,每次垃圾收集時都發現有大批對象死去,只有少量存活,那就選用復制算法,只需要付出少量存活對象的復制成本就可以完成收集。而老年代中因為對象存活率高、沒有額外空間對它進行分配擔保,就必須使用“標記-清理”或者“標記-整理”算法來進行回收。 說白了就是八仙過海各顯神通,具體問題具體分析了而已。 3.5 (了解)各種各樣的垃圾回收器HotSpot VM中的垃圾回收器,以及適用場景 到jdk8為止,默認的垃圾收集器是Parallel Scavenge 和 Parallel Old 從jdk9開始,G1收集器成為默認的垃圾收集器 3.6 (了解)JVM的常用參數JVM的參數非常之多,這里只列舉比較重要的幾個,通過各種各樣的搜索引擎也可以得知這些信息。
其實還有一些打印及CMS方面的參數,這里就不以一一列舉了 四、關于JVM調優的一些方面根據剛剛涉及的jvm的知識點,我們可以嘗試對JVM進行調優,主要就是堆內存那塊 所有線程共享數據區大小=新生代大小 + 年老代大小 + 持久代大小。持久代一般固定大小為64m。所以java堆中增大年輕代后,將會減小年老代大小(因為老年代的清理是使用fullgc,所以老年代過小的話反而是會增多fullgc的)。此值對系統性能影響較大,Sun官方推薦配置為java堆的3/8。 4.1 調整最大堆內存和最小堆內存-Xmx –Xms:指定java堆最大值(默認值是物理內存的1/4(<1GB))和初始java堆最小值(默認值是物理內存的1/64(<1GB)) 默認(MinHeapFreeRatio參數可以調整)空余堆內存小于40%時,JVM就會增大堆直到-Xmx的最大限制.,默認(MaxHeapFreeRatio參數可以調整)空余堆內存大于70%時,JVM會減少堆直到 -Xms的最小限制。簡單點來說,你不停地往堆內存里面丟數據,等它剩余大小小于40%了,JVM就會動態申請內存空間不過會小于-Xmx,如果剩余大小大于70%,又會動態縮小不過不會小于–Xms。就這么簡單 開發過程中,通常會將 -Xms 與 -Xmx兩個參數的配置相同的值,其目的是為了能夠在java垃圾回收機制清理完堆區后不需要重新分隔計算堆區的大小而浪費資源。 我們執行下面的代碼 System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間 System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間 System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M"); //當前可用的總空間 注意:此處設置的是Java堆大小,也就是新生代大小 + 老年代大小 設置一個VM options的參數 -Xmx20m -Xms5m -XX:+PrintGCDetails 再次啟動main方法 這里GC彈出了一個Allocation Failure分配失敗,這個事情發生在PSYoungGen,也就是年輕代中 這時候申請到的內存為18M,空閑內存為4.214195251464844M 我們此時創建一個字節數組看看,執行下面的代碼 byte[] b = new byte[1 * 1024 * 1024];System.out.println("分配了1M空間給數組"); System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間 System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間 System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M"); 此時free memory就又縮水了,不過total memory是沒有變化的。Java會盡可能將total mem的值維持在最小堆內存大小 byte[] b = new byte[10 * 1024 * 1024];System.out.println("分配了10M空間給數組"); System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間 System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間 System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M"); //當前可用的總空間 這時候我們創建了一個10M的字節數據,這時候最小堆內存是頂不住的。我們會發現現在的total memory已經變成了15M,這就是已經申請了一次內存的結果。 此時我們再跑一下這個代碼 System.gc(); System.out.println("Xmx=" + Runtime.getRuntime().maxMemory() / 1024.0 / 1024 + "M"); //系統的最大空間 System.out.println("free mem=" + Runtime.getRuntime().freeMemory() / 1024.0 / 1024 + "M"); //系統的空閑空間 System.out.println("total mem=" + Runtime.getRuntime().totalMemory() / 1024.0 / 1024 + "M"); //當前可用的總空間 此時我們手動執行了一次fullgc,此時total memory的內存空間又變回5.5M了,此時又是把申請的內存釋放掉的結果。 4.2 調整新生代和老年代的比值-XX:NewRatio --- 新生代(eden+2*Survivor)和老年代(不包含永久區)的比值 例如:-XX:NewRatio=4,表示新生代:老年代=1:4,即新生代占整個堆的1/5。在Xms=Xmx并且設置了Xmn的情況下,該參數不需要進行設置。 4.3 調整Survivor區和Eden區的比值-XX:SurvivorRatio(幸存代)--- 設置兩個Survivor區和eden的比值 例如:8,表示兩個Survivor:eden=2:8,即一個Survivor占年輕代的1/10 4.4 設置年輕代和老年代的大小-XX:NewSize --- 設置年輕代大小 -XX:MaxNewSize --- 設置年輕代最大值 可以通過設置不同參數來測試不同的情況,反正最優解當然就是官方的Eden和Survivor的占比為8:1:1,然后在剛剛介紹這些參數的時候都已經附帶了一些說明,感興趣的也可以看看。反正最大堆內存和最小堆內存如果數值不同會導致多次的gc,需要注意。 4.5 小總結根據實際事情調整新生代和幸存代的大小,官方推薦新生代占java堆的3/8,幸存代占新生代的1/10 在OOM時,記得Dump出堆,確保可以排查現場問題,通過下面命令你可以輸出一個.dump文件,這個文件可以使用VisualVM或者Java自帶的Java VisualVM工具。 -Xmx20m -Xms5m -XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=你要輸出的日志路徑 一般我們也可以通過編寫腳本的方式來讓OOM出現時給我們報個信,可以通過發送郵件或者重啟程序等來解決。 4.6 永久區的設置-XX:PermSize -XX:MaxPermSize 初始空間(默認為物理內存的1/64)和最大空間(默認為物理內存的1/4)。也就是說,jvm啟動時,永久區一開始就占用了PermSize大小的空間,如果空間還不夠,可以繼續擴展,但是不能超過MaxPermSize,否則會OOM。 tips:如果堆空間沒有用完也拋出了OOM,有可能是永久區導致的。堆空間實際占用非常少,但是永久區溢出 一樣拋出OOM。 4.7 JVM的棧參數調優4.7.1 調整每個線程棧空間的大小可以通過-Xss:調整每個線程棧空間的大小 JDK5.0以后每個線程堆棧大小為1M,以前每個線程堆棧大小為256K。在相同物理內存下,減小這個值能生成更多的線程。但是操作系統對一個進程內的線程數還是有限制的,不能無限生成,經驗值在3000~5000左右 4.7.2 設置線程棧的大小-XXThreadStackSize: 設置線程棧的大小(0 means use default stack size) 這些參數都是可以通過自己編寫程序去簡單測試的,這里礙于篇幅問題就不再提供demo了 4.8 (可以直接跳過了)JVM其他參數介紹形形色色的參數很多,就不會說把所有都扯個遍了,因為大家其實也不會說一定要去深究到底。 4.8.1 設置內存頁的大小-XXThreadStackSize: 設置內存頁的大小,不可設置過大,會影響Perm的大小復制代碼 4.8.2 設置原始類型的快速優化-XX:+UseFastAccessorMethods: 設置原始類型的快速優化 4.8.3 設置關閉手動GC-XX:+DisableExplicitGC: 設置關閉System.gc()(這個參數需要嚴格的測試) 4.8.4 設置垃圾最大年齡-XX:MaxTenuringThreshold 設置垃圾最大年齡。如果設置為0的話,則年輕代對象不經過Survivor區,直接進入年老代. 對于年老代比較多的應用,可以提高效率。如果將此值設置為一個較大值, 則年輕代對象會在Survivor區進行多次復制,這樣可以增加對象再年輕代的存活時間, 增加在年輕代即被回收的概率。該參數只有在串行GC時才有效. 4.8.5 加快編譯速度-XX:+AggressiveOpts 加快編譯速度 4.8.6 改善鎖機制性能-XX:+UseBiasedLocking 4.8.7 禁用垃圾回收-Xnoclassgc 4.8.8 設置堆空間存活時間-XX:SoftRefLRUPolicyMSPerMB 設置每兆堆空閑空間中SoftReference的存活時間,默認值是1s。 4.8.9 設置對象直接分配在老年代-XX:PretenureSizeThreshold 設置對象超過多大時直接在老年代分配,默認值是0。 4.8.10 設置TLAB占eden區的比例-XX:TLABWasteTargetPercent 設置TLAB占eden區的百分比,默認值是1% 。 4.8.11設置是否優先YGC-XX:+CollectGen0First 設置FullGC時是否先YGC,默認值是false。
|
|