鍍金池/ 問(wèn)答/人工智能  Python  網(wǎng)絡(luò)安全/ Python 如何獲取 PNG 格式的圖像數(shù)據(jù)

Python 如何獲取 PNG 格式的圖像數(shù)據(jù)

在學(xué)習(xí) PNG 的編碼規(guī)范,看了 PNG文件結(jié)構(gòu)分析,大概知道圖像的數(shù)據(jù)儲(chǔ)存在 IDAT 數(shù)據(jù)塊里,不過(guò)不是原始數(shù)據(jù),而是對(duì)其采用 Zlib 壓縮。
于是我在 Python 里 import zlib,對(duì) PNG 的圖像數(shù)據(jù)進(jìn)行解壓,似乎不能夠100%還原圖像數(shù)據(jù)。下面是我的操作過(guò)程。

這是我測(cè)試的 PNG 圖像:
PNG圖像

圖像大小是2*3像素,像素 RGBA 值如下:
#eb6100ff #22ac38ff #ea68a2ff
#22ac38ff #ea68a2ff #eb6100ff

對(duì)應(yīng)的十六進(jìn)制數(shù)據(jù):

89504e470d0a1a0a0000000d49484452000000030000000208060000009d74661a0000002349444154089963789dc8f05f698dc5ff57198bfe332aadb1f87f624f1603e3cf380600af940c90637dc1550000000049454e44ae426082

根據(jù) PNG 規(guī)范定義,IDAT 數(shù)據(jù)庫(kù)除去數(shù)據(jù)塊長(zhǎng)度碼、數(shù)據(jù)塊類型碼、CRC碼,剩下的就是 IDAT 的內(nèi)容數(shù)據(jù)塊:089963789dc8f05f698dc5ff57198bfe332aadb1f87f624f1603e3cf380600af940c90
然后在 Python 2.7 用 zlib 對(duì)其進(jìn)行解壓:

import zlib
bitData = '089963789dc8f05f698dc5ff57198bfe332aadb1f87f624f1603e3cf380600af940c90'
print zlib.decompress(bitData.decode('hex')).encode('hex')

得到輸出:
00eb6100ff22ac38ffea68a2ff0122ac38ffc8bc6a0001f95e00

除去掃描行序列0001得到每一個(gè)像素的 RGBA 值:
#eb6100ff #22ac38ff #ea68a2ff
#22ac38ff #c8bc6a00 #01f95e00

對(duì)比前面像素的 RGBA 值,可見(jiàn)第2行的最后2個(gè)像素(c8bc6a0001f95e00)的 RGBA 不是原來(lái)的值。不知是哪個(gè)環(huán)節(jié)出了問(wèn)題,希望 SF 的大神解答下,先謝過(guò)了,跪~

回答
編輯回答
你的瞳

在查看對(duì)比這個(gè)PNG解壓源碼與題主的操作流程,發(fā)現(xiàn)問(wèn)題在于少了undo_filter這一步。

在源碼png.py中

...
            while len(a) >= rb + 1:
                filter_type = a[0]
                scanline = a[1:rb+1]
                del a[:rb+1]
                recon = self.undo_filter(filter_type, scanline, recon)
...

可以看出,每行的第一個(gè)字節(jié)是代表filter_type, 不是行號(hào)?。ㄒ?yàn)橐膊恍枰。?br>00eb6100ff22ac38ffea68a2ff0122ac38ffc8bc6a0001f95e00
這里的00是沒(méi)有用濾波器,01是指用了減法濾波器

減法濾波器的定義:

 def sub():
            """Undo sub filter."""

            ai = 0
            # Loops starts at index fu.  Observe that the initial part
            # of the result is already filled in correctly with
            # scanline.
            for i in range(fu, len(result)):
                x = scanline[i]
                a = result[ai]
                result[i] = (x + a) & 0xff
                ai += 1

c8bc6a00+22ac38ff=ea68a2ff (注意忽略字節(jié)進(jìn)位,即 &ff的作用)

2017年3月10日 01:41