PNG文件結構分析(上:了解PNG文件存儲格式)前言 我們都知道,在進行J2ME的手機應用程序開發的時候,在圖片的使用上,我們可以使用PNG格式的圖片(甚至于在有的手機上,我們只可以使用PNG 格式的圖片),盡管使用圖片可以為我們的應用程序增加不少亮點,然而,只支持PNG格式的圖片卻又限制了我們進一步發揮的可能性(其實,應該說是由于手機 平臺上的處理能力有限)。 在MIDP2中,或者某些廠商(如NOKIA)提供的API中,提供了drawPixels/getPixels的方法,這些方法進一步提高了開發者處理 圖片的靈活性,然而,在MIDP2還未完全普及的今天,我們需要在MIDP1 .0中實現這類方法還屬于異想天開,因此,為了實現更高級的應用,我們必須充分挖掘PNG的潛力。 PNG的文件結構 對于一個PNG文件來說,其文件頭總是由位固定的字節來描述的:
其中第一個字節0x89超出了ASCII字符的范圍,這是為了避免某些軟件將PNG文件當做文本文件來處理。文件中剩余的部分由3個以上的PNG的數據塊(Chunk)按照特定的順序組成,因此,一個標準的PNG文件結構應該如下:
PNG數據塊(Chunk) PNG定義了兩種類型的數據塊,一種是稱為關鍵數據塊(critical chunk),這是標準的數據塊,另一種叫做輔助數據塊(ancillary chunks),這是可選的數據塊。關鍵數據塊定義了4個標準數據塊,每個PNG文件都必須包含它們,PNG讀寫軟件也都必須要支持這些數據塊。雖然 PNG文件規范沒有要求PNG編譯碼器對可選數據塊進行編碼和譯碼,但規范提倡支持可選數據塊。 下表就是PNG中數據塊的類別,其中,關鍵數據塊部分我們使用深色背景加以區分。
為了簡單起見,我們假設在我們使用的PNG文件中,這4個數據塊按以上先后順序進行存儲,并且都只出現一次。 數據塊結構 PNG文件中,每個數據塊由4個部分組成,如下:
CRC(cyclic redundancy check)域中的值是對Chunk Type Code域和Chunk Data域中的數據進行計算得到的。CRC具體算法定義在ISO 3309和ITU-T V.42中,其值按下面的CRC碼生成多項式進行計算: x32+x26+x23+x22+x16+x12+x11+x10+x8+x7+x5+x4+x2+x+1 下面,我們依次來了解一下各個關鍵數據塊的結構吧。 IHDR 文件頭數據塊IHDR(header chunk):它包含有PNG文件中存儲的圖像數據的基本信息,并要作為第一個數據塊出現在PNG數據流中,而且一個PNG數據流中只能有一個文件頭數據塊。 文件頭數據塊由13字節組成,它的格式如下表所示。
由于我們研究的是手機上的PNG,因此,首先我們看看MIDP1.0對所使用PNG圖片的要求吧:
關于更多的信息,可以參考http://www./TR/REC-png.html PLTE 調色板數據塊PLTE(palette chunk)包含有與索引彩色圖像(indexed-color image)相關的彩色變換數據,它僅與索引彩色圖像有關,而且要放在圖像數據塊(image data chunk)之前。 PLTE數據塊是定義圖像的調色板信息,PLTE可以包含1~256個調色板信息,每一個調色板信息由3個字節組成:
因此,調色板的長度應該是3的倍數,否則,這將是一個非法的調色板。 對于索引圖像,調色板信息是必須的,調色板的顏色索引從0開始編號,然后是1、2……,調色板的顏色數不能超過色深中規定的顏色數(如圖像色深為4的時候,調色板中的顏色數不可以超過2^4=16),否則,這將導致PNG圖像不合法。 真彩色圖像和帶α通道數據的真彩色圖像也可以有調色板數據塊,目的是便于非真彩色顯示程序用它來量化圖像數據,從而顯示該圖像。 IDAT 圖像數據塊IDAT(image data chunk):它存儲實際的數據,在數據流中可包含多個連續順序的圖像數據塊。 IDAT存放著圖像真正的數據信息,因此,如果能夠了解IDAT的結構,我們就可以很方便的生成PNG圖像。 IEND 圖像結束數據IEND(image trailer chunk):它用來標記PNG文件或者數據流已經結束,并且必須要放在文件的尾部。 如果我們仔細觀察PNG文件,我們會發現,文件的結尾12個字符看起來總應該是這樣的: 00 00 00 00 49 45 4E 44 AE 42 60 82 不難明白,由于數據塊結構的定義,IEND數據塊的長度總是0(00 00 00 00,除非人為加入信息),數據標識總是IEND(49 45 4E 44),因此,CRC碼也總是AE 42 60 82。 實例研究PNG 以下是由Fireworks生成的一幅圖像,圖像大小為8*8,
可以看到,選中的頭8個字節即為PNG文件的標識。 接下來的地方就是IHDR數據塊了: 00000008~00000020:
00000021~0000002F: 可選數據塊sBIT,顏色采樣率,RGB都是256(2^8=256) 00000030~00000062: 這里是調色板信息
00000063~000000C5: 這部分包含了pHYs、tExt兩種類型的數據塊共3塊,由于并不太重要,因此也不再詳細描述了。 以上選中部分是IDAT數據塊
IDAT中壓縮數據部分在后面會有詳細的介紹。 000000F9~00000104: IEND數據塊,這部分正如上所說,通常都應該是 00 00 00 00 49 45 4E 44 AE 42 60 82 至此,我們已經能夠從一個PNG文件中識別出各個數據塊了。由于PNG中規定除關鍵數據塊外,其它的輔助數據塊都為可選部分,因此,有了這個標準 后,我們可以通過刪除所有的輔助數據塊來減少PNG文件的大小。(當然,需要注意的是,PNG格式可以保存圖像中的層、文字等信息,一旦刪除了這些輔助數 據塊后,圖像將失去原來的可編輯性。) 刪除了輔助數據塊后的PNG文件,現在文件大小為147字節,原文件大小為261字節,文件大小減少后,并不影響圖像的內容。 其實,我們可以通過改變調色板的色值來完成一些又趣的事情,比如說實現云彩/水波的流動效果,實現圖像的淡入淡出效果等等,在此,給出一個鏈接給大家看也許更直接:http://blog.csdn.net/flyingghost/archive/2005/01/13/251110.aspx,我寫此文也就是受此文的啟發的。 如上說過,IDAT數據塊是使用了LZ77壓縮算法生成的,由于受限于手機處理器的能力,因此,如果我們在生成IDAT數據塊時仍然使用LZ77壓 縮算法,將會使效率大打折扣,因此,為了效率,只能使用無壓縮的LZ77算法,關于LZ77算法的具體實現,此文不打算深究,如果你對LZ77算法的 JAVA實現有興趣,可以參考以下兩個站點: PNG文件結構分析(下:在手機上生成PNG文件) 上面我們已經對PNG的存儲格式有了了解,因此,生成PNG圖片只需要按照以上的數據塊寫入文件即可。 (由于IHDR、PLTE的結構都非常簡單,因此,這里我們只是重點講一講IDAT的生成方法,IHDR和PLTE的數據內容都沿用以上的數據內容) 問題確實是這樣的,我們知道,對于大多數的圖形文件來說,我們都可以將實際的圖像內容映射為一個二維的顏色數組,對于上面的PNG文件,由于它用的是16色的調色板(實際是13色),因此,對于圖片的映射可以如下:
PNG Spec中指出,如果PNG文件不是采用隔行掃描方法存儲的話,那么,數據是按照行(ScanLine)來存儲的,為了區分第一行,PNG規定在每一行的前面加上0以示區分,因此,上面的圖像映射應該如下:
另外,需要注意的是,由于PNG在存儲圖像時為了節省空間,因此每一行是按照位(Bit)來存儲的,而并不是我們想象的字節(Byte),如果你沒有忘記的話,我們的IHDR數據塊中的色深就指明了這一點,所以,為了湊成PNG所需要的IDAT,我們的數據得改成如下:
最后,我們對這些數據進行LZ77壓縮就可以得到IDAT的正確內容了。 然而,事情并不是這么簡單,因為我們研究的是手機上的PNG,如果需要在手機上完成LZ77壓縮工作,消耗的時間是可想而知的,因此,我們得再想辦法加減少壓縮時消耗的時間。 好在LZ77也提供了無壓縮的壓縮方法(奇怪吧?),因此,我們只需要簡單的使用無壓縮的方式寫入數據就可以了,這樣雖然浪費了空間,卻換回了時間! 好了,讓我們看一看怎么樣湊成無壓縮的LZ77壓縮塊:
其中的LEN是指數據的長度,占用兩個字節,對于我們的圖像來說,第一個Scan Line包含了5個字節(如第一行的0, 203, 169, 135, 101),所以LEN的值為5(字節/行) * 8(行) = 40(字節),生成字節為28 00(低字節在前),NLEN是LEN的補碼,即NLEN = LEN ^ 0xFFFF,所以NLEN的為 D7 FF,Adler32信息為24 A7 0B A4(具體算法見源程序),因此,按照這樣的順序,我們生成IDAT數據塊,最后,我們將IHDR、PLTE、IDAT和IEND數據塊寫入文件中,就可 以得到PNG文件了,如圖:
至此,我們已經能夠采用最快的時間將數組轉換為PNG圖片了。 參考資料: PNG文件格式白皮書:http://www./TR/REC-png.html |
|