今天幫師姐解決一個bug,測試了Python圖像resize前后顏色不一致問題。
宜良網(wǎng)站制作公司哪家好,找創(chuàng)新互聯(lián)公司!從網(wǎng)頁設計、網(wǎng)站建設、微信開發(fā)、APP開發(fā)、成都響應式網(wǎng)站建設公司等網(wǎng)站項目制作,到程序開發(fā),運營維護。創(chuàng)新互聯(lián)公司于2013年成立到現(xiàn)在10年的時間,我們擁有了豐富的建站經驗和運維經驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設就選創(chuàng)新互聯(lián)公司。
代碼片段執(zhí)行的功能:圖像指定倍數(shù)超分辨率,輸入為[0-1] float型數(shù)據(jù),輸出為格式不限的圖像
bug:輸入圖像與輸出圖像顏色不一致
一、把產生bug的功能片段做分離測試:
1 import h5py
2 import numpy as np
3 import matplotlib.pyplot as plt
4 from PIL import Image
5 from scipy import misc
6
7
8 def get_result_array():
9 file_name = "./butterfly_GT.bmp"
10 img_no_expand = misc.imread(file_name, flatten=False, mode='YCbCr')
11 img_no_expand = img_no_expand / 255.0
12 # img_no_expand = np.uint8(img_no_expand*255)
13 h, w = img_no_expand.shape[:2]
14 print(img_no_expand.shape)
15 h *= 2
16 w *= 2
17 data = list()
18
19 data.append(misc.imresize(img_no_expand[:, :, 0], [h, w], 'bicubic')[:,:,None])
20 data.append(misc.imresize(img_no_expand[:, :, 1], [h, w], 'bicubic')[:,:,None])
21 data.append(misc.imresize(img_no_expand[:, :, 2], [h, w], 'bicubic')[:,:,None])
22 data_out = np.concatenate(data, axis=2)
23 img = misc.toimage(arr=data_out, mode="YCbCr")
24 img.save("out_3.jpg")
25
26
27 if __name__=='__main__':
28 get_result_array()
運行代碼:
左圖為輸入圖像,右圖為輸出圖像。為了便于對比,把輸出圖像縮放至與輸入圖像一致,由圖可見,輸出圖像色彩嚴重失真。
二、在pycharm中,Ctrl+B 查看源碼:
三、發(fā)現(xiàn)可以選擇模式,猜想可能是模式有誤:
四、在函數(shù)的實現(xiàn)的第一行,初始化Image類,猜想初始化參數(shù)設置錯誤。
五、在類的初始化過程中,默認圖像的最大值為255,而實際輸入是0-1的float型數(shù)據(jù)。找到了錯誤之處。
六、仔細查看文檔,mode可以修改。0-1float型數(shù)據(jù)對應mode=“F”:
七、于是,在代碼中加入?yún)?shù):
八、插值后處理
插值之后部分像素點數(shù)值可能大于1,這時有兩種做法,一種是歸一化,一種是截斷。經過實驗發(fā)現(xiàn),歸一化操作往往會使圖像整體亮度變暗,對圖像整體視覺效果有較大影響,因此這里選擇截斷。
九、最終代碼如下:
1 import h5py
2 import numpy as np
3 import matplotlib.pyplot as plt
4 from PIL import Image
5 from scipy import misc
6
7
8 def get_result_array():
9 file_name = "./butterfly_GT.bmp"
10 img_no_expand = misc.imread(file_name, flatten=False, mode='YCbCr')
11 img_no_expand = img_no_expand / 255.0
12 # img_no_expand = np.uint8(img_no_expand*255)
13 h, w = img_no_expand.shape[:2]
14 print(img_no_expand.shape)
15 h *= 2
16 w *= 2
17 data = list()
18 data.append(misc.imresize(img_no_expand[:, :, 0], [h, w], 'bicubic', mode="F")[:,:,None])
19 data.append(misc.imresize(img_no_expand[:, :, 1], [h, w], 'bicubic', mode="F")[:,:,None])
20 data.append(misc.imresize(img_no_expand[:, :, 2], [h, w], 'bicubic', mode="F")[:,:,None])
21 data_out = np.concatenate(data, axis=2)
22 data_out[data_out 1] = 1.0
23 data_out = np.uint8(data_out * 255)
24 img = misc.toimage(arr=data_out, mode="YCbCr")
25 img.save("out_4.jpg")
26
27
28 if __name__=='__main__':
29 get_result_array()
PIL (Python Imaging Library)
Python圖像處理庫,該庫支持多種文件格式,提供強大的圖像處理功能。
PIL中最重要的類是Image類,該類在Image模塊中定義。
從文件加載圖像:
如果成功,這個函數(shù)返回一個Image對象。現(xiàn)在你可以使用該對象的屬性來探索文件的內容。
format 屬性指定了圖像文件的格式,如果圖像不是從文件中加載的則為 None 。
size 屬性是一個2個元素的元組,包含圖像寬度和高度(像素)。
mode 屬性定義了像素格式,常用的像素格式為:“L” (luminance) - 灰度圖, “RGB” , “CMYK”。
如果文件打開失敗, 將拋出IOError異常。
一旦你擁有一個Image類的實例,你就可以用該類定義的方法操作圖像。比如:顯示
( show() 的標準實現(xiàn)不是很有效率,因為它將圖像保存到一個臨時文件,然后調用外部工具(比如系統(tǒng)的默認圖片查看軟件)顯示圖像。該函數(shù)將是一個非常方便的調試和測試工具。)
接下來的部分展示了該庫提供的不同功能。
PIL支持多種圖像格式。從磁盤中讀取文件,只需使用 Image 模塊中的 open 函數(shù)。不需要提供文件的圖像格式。PIL庫將根據(jù)文件內容自動檢測。
如果要保存到文件,使用 Image 模塊中的 save 函數(shù)。當保存文件時,文件名很重要,除非指定格式,否則PIL庫將根據(jù)文件的擴展名來決定使用哪種格式保存。
** 轉換文件到JPEG **
save 函數(shù)的第二個參數(shù)可以指定使用的文件格式。如果文件名中使用了一個非標準的擴展名,則必須通過第二個參數(shù)來指定文件格式。
** 創(chuàng)建JPEG縮略圖 **
需要注意的是,PIL只有在需要的時候才加載像素數(shù)據(jù)。當你打開一個文件時,PIL只是讀取文件頭獲得文件格式、圖像模式、圖像大小等屬性,而像素數(shù)據(jù)只有在需要的時候才會加載。
這意味著打開一個圖像文件是一個非??斓牟僮?,不會受文件大小和壓縮算法類型的影響。
** 獲得圖像信息 **
Image 類提供了某些方法,可以操作圖像的子區(qū)域。提取圖像的某個子區(qū)域,使用 crop() 函數(shù)。
** 復制圖像的子區(qū)域 **
定義區(qū)域使用一個包含4個元素的元組,(left, upper, right, lower)。坐標原點位于左上角。上面的例子提取的子區(qū)域包含300x300個像素。
該區(qū)域可以做接下來的處理然后再粘貼回去。
** 處理子區(qū)域然后粘貼回去 **
當往回粘貼時,區(qū)域的大小必須和參數(shù)匹配。另外區(qū)域不能超出圖像的邊界。然而原圖像和區(qū)域的顏色模式無需匹配。區(qū)域會自動轉換。
** 滾動圖像 **
paste() 函數(shù)有個可選參數(shù),接受一個掩碼圖像。掩碼中255表示指定位置為不透明,0表示粘貼的圖像完全透明,中間的值表示不同級別的透明度。
PIL允許分別操作多通道圖像的每個通道,比如RGB圖像。 split() 函數(shù)創(chuàng)建一個圖像集合,每個圖像包含一個通道。 merge() 函數(shù)接受一個顏色模式和一個圖像元組,然后將它們合并為一個新的圖像。接下來的例子交換了一個RGB圖像的三個通道。
** 分離和合并圖像通道 **
對于單通道圖像, split() 函數(shù)返回圖像本身。如果想處理各個顏色通道,你可能需要先將圖像轉為RGB模式。
resize() 函數(shù)接受一個元組,指定圖像的新大小。
rotate() 函數(shù)接受一個角度值,逆時針旋轉。
** 基本幾何變換 **
圖像旋轉90度也可以使用 transpose() 函數(shù)。 transpose() 函數(shù)也可以水平或垂直翻轉圖像。
** transpose **
transpose() 和 rotate() 函數(shù)在性能和結果上沒有區(qū)別。
更通用的圖像變換函數(shù)為 transform() 。
PIL可以轉換圖像的像素模式。
** 轉換顏色模式 **
PIL庫支持從其他模式轉為“L”或“RGB”模式,其他模式之間轉換,則需要使用一個中間圖像,通常是“RGB”圖像。
ImageFilter 模塊包含多個預定義的圖像增強過濾器用于 filter() 函數(shù)。
** 應用過濾器 **
point() 函數(shù)用于操作圖像的像素值。該函數(shù)通常需要傳入一個函數(shù)對象,用于操作圖像的每個像素:
** 應用點操作 **
使用以上技術可以快速地對圖像像素應用任何簡單的表達式。可以結合 point() 函數(shù)和 paste 函數(shù)修改圖像。
** 處理圖像的各個通道 **
注意用于創(chuàng)建掩碼圖像的語法:
Python計算邏輯表達式采用短路方式,即:如果and運算符左側為false,就不再計算and右側的表達式,而且返回結果是表達式的結果。比如 a and b 如果a為false則返回a,如果a為true則返回b,詳見Python語法。
對于更多高級的圖像增強功能,可以使用 ImageEnhance 模塊中的類。
可以調整圖像對比度、亮度、色彩平衡、銳度等。
** 增強圖像 **
PIL庫包含對圖像序列(動畫格式)的基本支持。支持的序列格式包括 FLI/FLC 、 GIF 和一些實驗性的格式。 TIFF 文件也可以包含多個幀。
當打開一個序列文件時,PIL庫自動加載第一幀。你可以使用 seek() 函數(shù) tell() 函數(shù)在不同幀之間移動。
** 讀取序列 **
如例子中展示的,當序列到達結尾時,將拋出EOFError異常。
注意當前版本的庫中多數(shù)底層驅動只允許seek到下一幀。如果想回到前面的幀,只能重新打開圖像。
以下迭代器類允許在for語句中循環(huán)遍歷序列:
** 一個序列迭代器類 **
PIL庫包含一些函數(shù)用于將圖像、文本打印到Postscript打印機。以下是一個簡單的例子。
** 打印到Postscript **
如前所述,可以使用 open() 函數(shù)打開圖像文件,通常傳入一個文件名作為參數(shù):
如果打開成功,返回一個Image對象,否則拋出IOError異常。
也可以使用一個file-like object代替文件名(暫可以理解為文件句柄)。該對象必須實現(xiàn)read,seek,tell函數(shù),必須以二進制模式打開。
** 從文件句柄打開圖像 **
如果從字符串數(shù)據(jù)中讀取圖像,使用StringIO類:
** 從字符串中讀取 **
如果圖像文件內嵌在一個大文件里,比如 tar 文件中。可以使用ContainerIO或TarIO模塊來訪問。
** 從tar文檔中讀取 **
** 該小節(jié)不太理解,請參考原文 **
有些解碼器允許當讀取文件時操作圖像。通常用于在創(chuàng)建縮略圖時加速解碼(當速度比質量重要時)和輸出一個灰度圖到激光打印機時。
draft() 函數(shù)。
** Reading in draft mode **
輸出類似以下內容:
注意結果圖像可能不會和請求的模式和大小匹配。如果要確保圖像不大于指定的大小,請使用 thumbnail 函數(shù)。
Python2.7 教程 PIL
Python 之 使用 PIL 庫做圖像處理
來自
為避免中文顯示出錯,需導入matplotlib.pylab庫
1.2.1 確定數(shù)據(jù)
1.2.2 創(chuàng)建畫布
1.2.3 添加標題
1.2.4 添加x,y軸名稱
1.2.5 添加x,y軸范圍
1.2.6 添加x,y軸刻度
1.2.7 繪制曲線、圖例, 并保存圖片
保存圖片時,dpi為清晰度,數(shù)值越高越清晰。請注意,函數(shù)結尾處,必須加plt.show(),不然圖像不顯示。
繪制流程與繪制不含子圖的圖像一致,只需注意一點:創(chuàng)建畫布。
合理調整figsize、dpi,可避免出現(xiàn)第一幅圖橫軸名稱與第二幅圖標題相互遮蓋的現(xiàn)象.
2.2.1 rc參數(shù)類型
2.2.2 方法1:使用rcParams設置
2.2.3 方法2:plot內設置
2.2.4 方法3:plot內簡化設置
方法2中,線條形狀,linestyle可簡寫為ls;線條寬度,linewidth可簡寫為lw;線條顏色,color可簡寫為c,等等。
你好,答案如下所示。
填充為黃色
填充效果
希望你能夠詳細查看。
如果你有不會的,你可以提問
我有時間就會幫你解答。
希望你好好學習。
每一天都過得充實。
示例代碼
# 導入Tkinter模塊
from tkinter import *
# 創(chuàng)建一個窗口
window = Tk()
# 定義一個函數(shù),用來生成圖形
def generate_shape():
# 使用隨機數(shù)生成不同的圖形和顏色
shape = random.choice(["circle", "square", "triangle"])
color = random.choice(["red", "green", "blue"])
# 使用隨機數(shù)生成不同的位置
x = random.randint(0, 200)
y = random.randint(0, 200)
# 在窗口中繪制圖形
if shape == "circle":
# 繪制圓形
canvas.create_oval(x, y, x + 50, y + 50, fill=color)
elif shape == "square":
# 繪制正方形
canvas.create_rectangle(x, y, x + 50, y + 50, fill=color)
else:
# 繪制三角形
points = [x, y, x + 50, y + 50, x + 25, y + 75]
canvas.create_polygon(points, fill=color)
# 創(chuàng)建一個畫布
canvas = Canvas(window, width=200, height=200)
canvas.pack()
# 創(chuàng)建一個按鈕
button = Button(window, text="Start", command=generate_shape)
button.pack()
# 進入消息循環(huán)
window.mainloop()