gcc/g++ 優化標識 -O1 -O2 -O3 -Os -Ofast -Og的作用

lichwoo 2025-01-08 發布于中國香港

展開全文

文章目錄

注意：用GDB調試的時候需要關閉優化選項

當優化標識被啟用之后，gcc編譯器將會試圖在不改變程序語義的情況下改變程序的結構，
以滿足代碼大小最小或運行速度更快等目標

1. -O，-O1

這兩個命令的效果是一樣的，目的都是在不影響編譯速度的前提下，盡量采用一些優化算法降低代碼大小和可執行代碼的運行速度。并開啟如下的優化選項：

-fauto-inc-dec 
-fbranch-count-reg 
-fcombine-stack-adjustments 
-fcompare-elim 
-fcprop-registers 
-fdce 
-fdefer-pop 
-fdelayed-branch 
-fdse 
-fforward-propagate 
-fguess-branch-probability 
-fif-conversion2 
-fif-conversion 
-finline-functions-called-once 
-fipa-pure-const 
-fipa-profile 
-fipa-reference 
-fmerge-constants 
-fmove-loop-invariants 
-freorder-blocks 
-fshrink-wrap 
-fshrink-wrap-separate 
-fsplit-wide-types 
-fssa-backprop 
-fssa-phiopt 
-fstore-merging 
-ftree-bit-ccp 
-ftree-ccp 
-ftree-ch 
-ftree-coalesce-vars 
-ftree-copy-prop 
-ftree-dce 
-ftree-dominator-opts 
-ftree-dse 
-ftree-forwprop 
-ftree-fre 
-ftree-phiprop 
-ftree-sink 
-ftree-slsr 
-ftree-sra 
-ftree-pta 
-ftree-ter 
-funit-at-a-time

2. -O2

該優化選項會犧牲部分編譯速度，除了執行-O1所執行的所有優化之外，還會采用幾乎所有的目標配置支持的優化算法，用以提高目標代碼的運行速度

-fthread-jumps 
-falign-functions  -falign-jumps 
-falign-loops  -falign-labels 
-fcaller-saves 
-fcrossjumping 
-fcse-follow-jumps  -fcse-skip-blocks 
-fdelete-null-pointer-checks 
-fdevirtualize -fdevirtualize-speculatively 
-fexpensive-optimizations 
-fgcse  -fgcse-lm  
-fhoist-adjacent-loads 
-finline-small-functions 
-findirect-inlining 
-fipa-cp 
-fipa-cp-alignment 
-fipa-bit-cp 
-fipa-sra 
-fipa-icf 
-fisolate-erroneous-paths-dereference 
-flra-remat 
-foptimize-sibling-calls 
-foptimize-strlen 
-fpartial-inlining 
-fpeephole2 
-freorder-blocks-algorithm=stc 
-freorder-blocks-and-partition -freorder-functions 
-frerun-cse-after-loop  
-fsched-interblock  -fsched-spec 
-fschedule-insns  -fschedule-insns2 
-fstrict-aliasing -fstrict-overflow 
-ftree-builtin-call-dce 
-ftree-switch-conversion -ftree-tail-merge 
-fcode-hoisting 
-ftree-pre 
-ftree-vrp 
-fipa-ra

3. -O3

該選項除了執行-O2所有的優化選項之外，一般都是采取很多向量化算法，提高代碼的并行執行程度，利用現代CPU中的流水線，Cache等

-finline-functions      // 采用一些啟發式算法對函數進行內聯
-funswitch-loops        // 執行循環unswitch變換
-fpredictive-commoning  // 
-fgcse-after-reload     //執行全局的共同子表達式消除
-ftree-loop-vectorize　  // 
-ftree-loop-distribute-patterns
-fsplit-paths 
-ftree-slp-vectorize
-fvect-cost-model
-ftree-partial-pre
-fpeel-loops 
-fipa-cp-clone options

4. -Os

這個優化標識和-O3有異曲同工之妙，當然兩者的目標不一樣，
-O3的目標是寧愿增加目標代碼的大小，也要拼命的提高運行速度，
但是這個選項是在-O2的基礎之上，盡量的降低目標代碼的大小，這對于存儲容量很小的設備來說非常重要。
為了降低目標代碼大小，會禁用下列優化選項，一般就是壓縮內存中的對齊空白(alignment padding)

-falign-functions  
-falign-jumps  
-falign-loops 
-falign-labels
-freorder-blocks  
-freorder-blocks-algorithm=stc 
-freorder-blocks-and-partition  
-fprefetch-loop-arrays

5. -Ofast

該選項將不會嚴格遵循語言標準，除了啟用所有的-O3優化選項之外，也會針對某些語言啟用部分優化。如：-ffast-math ，對于Fortran語言，還會啟用下列選項

-fno-protect-parens 
-fstack-arrays

6.-Og

優化調試體驗。 -Og應該是標準edit-compile-debug周期的優化級別選擇，
在保持快速編譯和良好調試體驗的同時，提供合理的優化級別。
用于生成可調試代碼，因為某些收集調試信息的編譯器通道在以下位置被禁用 -O0。
像-O0 -Og完全禁用了許多優化過程，因此控制它們的單個選項無效。除此以外-Og 使所有 -O1 優化標志，但那些可能會干擾調試的標志除外：

-fbranch-count-reg  
-fdelayed-branch 
-fdse  
-fif-conversion  
-fif-conversion2  
-finline-functions-called-once 
-fmove-loop-invariants  
-fssa-phiopt 
-ftree-bit-ccp  
-ftree-dse  
-ftree-pta  
-ftree-sra