原文標(biāo)題:10 Python image manipulation tools.
成都創(chuàng)新互聯(lián)主要從事做網(wǎng)站、成都網(wǎng)站建設(shè)、網(wǎng)頁設(shè)計、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)溧水,10多年網(wǎng)站建設(shè)經(jīng)驗,價格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):18982081108
作者 | Parul Pandey
翻譯 | 安其羅喬爾、JimmyHua
今天,在我們的世界里充滿了數(shù)據(jù),圖像成為構(gòu)成這些數(shù)據(jù)的重要組成部分。但無論是用于何種用途,這些圖像都需要進(jìn)行處理。圖像處理就是分析和處理數(shù)字圖像的過程,主要旨在提高其質(zhì)量或從中提取一些信息,然后可以將其用于某種用途。
圖像處理中的常見任務(wù)包括顯示圖像,基本操作如裁剪、翻轉(zhuǎn)、旋轉(zhuǎn)等,圖像分割,分類和特征提取,圖像恢復(fù)和圖像識別。Python成為這種圖像處理任務(wù)是一個恰當(dāng)選擇,這是因為它作為一種科學(xué)編程語言正在日益普及,并且在其生態(tài)系統(tǒng)中免費提供許多最先進(jìn)的圖像處理工具供大家使用。
讓我們看一下可以用于圖像處理任務(wù)中的常用 Python 庫有哪些吧。
1.scikit-image
scikit-image是一個開源的Python包,適用于numpy數(shù)組。它實現(xiàn)了用于研究,教育和工業(yè)應(yīng)用的算法和實用工具。即使是那些剛接觸Python生態(tài)系統(tǒng)的人,它也是一個相當(dāng)簡單直接的庫。此代碼是由活躍的志愿者社區(qū)編寫的,具有高質(zhì)量和同行評審的性質(zhì)。
資源
文檔里記錄了豐富的例子和實際用例,閱讀下面的文檔:
用法
該包作為skimage導(dǎo)入,大多數(shù)功能都在子模塊中找的到。下面列舉一些skimage的例子:
圖像過濾
使用match_template函數(shù)進(jìn)行模板匹配
你可以通過此處查看圖庫找到更多示例。
2. Numpy
Numpy是Python編程的核心庫之一,并為數(shù)組提供支持。圖像本質(zhì)上是包含數(shù)據(jù)點像素的標(biāo)準(zhǔn)Numpy數(shù)組。因此,我們可以通過使用基本的NumPy操作,例如切片、掩膜和花式索引,來修改圖像的像素值。可以使用skimage加載圖像并使用matplotlib顯示圖像。
資源
Numpy的官方文檔頁面提供了完整的資源和文檔列表:
用法
使用Numpy來掩膜圖像.
3.Scipy
scipy是Python的另一個類似Numpy的核心科學(xué)模塊,可用于基本的圖像操作和處理任務(wù)。特別是子模塊scipy.ndimage,提供了在n維NumPy數(shù)組上操作的函數(shù)。該包目前包括線性和非線性濾波,二值形態(tài)學(xué),B樣條插值和對象測量等功能函數(shù)。
資源
有關(guān)scipy.ndimage包提供的完整功能列表,請參閱下面的鏈接:
用法
使用SciPy通過高斯濾波器進(jìn)行模糊:
4. PIL/ Pillow
PIL( Python圖像庫 )是Python編程語言的一個免費庫,它支持打開、操作和保存許多不同的文件格式的圖像。然而, 隨著2009年的最后一次發(fā)布,它的開發(fā)停滯不前。但幸運的是還有有Pillow,一個PIL積極開發(fā)的且更容易安裝的分支,它能運行在所有主要的操作系統(tǒng),并支持Python3。這個庫包含了基本的圖像處理功能,包括點運算、使用一組內(nèi)置卷積核的濾波和色彩空間的轉(zhuǎn)換。
資源
文檔中有安裝說明,以及涵蓋庫的每個模塊的示例:
用法
在 Pillow 中使用 ImageFilter 增強(qiáng)圖像:
5. OpenCV-Python
OpenCV( 開源計算機(jī)視覺庫 )是計算機(jī)視覺應(yīng)用中應(yīng)用最廣泛的庫之一 。OpenCV-Python 是OpenCV的python版API。OpenCV-Python的優(yōu)點不只有高效,這源于它的內(nèi)部組成是用C/C++編寫的,而且它還容易編寫和部署(因為前端是用Python包裝的)。這使得它成為執(zhí)行計算密集型計算機(jī)視覺程序的一個很好的選擇。
資源
OpenCV-Python-Guide指南可以讓你使用OpenCV-Python更容易:
用法
下面是一個例子,展示了OpenCV-Python使用金字塔方法創(chuàng)建一個名為“Orapple”的新水果圖像融合的功能。
6. SimpleCV
SimpleCV 也是一個用于構(gòu)建計算機(jī)視覺應(yīng)用程序的開源框架。有了它,你就可以訪問幾個高性能的計算機(jī)視覺庫,如OpenCV,而且不需要先學(xué)習(xí)了解位深度、文件格式、顏色空間等。
它的學(xué)習(xí)曲線大大小于OpenCV,正如它們的口號所說“計算機(jī)視覺變得簡單”。一些支持SimpleCV的觀點有:
即使是初學(xué)者也可以編寫簡單的機(jī)器視覺測試攝像機(jī)、視頻文件、圖像和視頻流都是可互操作的資源
官方文檔非常容易理解,而且有大量的例子和使用案例去學(xué)習(xí):
用法
7. Mahotas
Mahotas 是另一個計算機(jī)視覺和圖像處理的Python庫。它包括了傳統(tǒng)的圖像處理功能例如濾波和形態(tài)學(xué)操作以及更現(xiàn)代的計算機(jī)視覺功能用于特征計算,包括興趣點檢測和局部描述符。該接口是Python語言,適合于快速開發(fā),但是算法是用C語言實現(xiàn)的,并根據(jù)速度進(jìn)行了調(diào)優(yōu)。Mahotas庫速度快,代碼簡潔,甚至具有最小的依賴性。通過原文閱讀它們的官方論文以獲得更多的了解。
資源
文檔包括安裝指導(dǎo),例子,以及一些教程,可以更好的幫助你開始使用mahotas。
用法
Mahotas庫依賴于使用簡單的代碼來完成任務(wù)。關(guān)于‘Finding Wally’的問題,Mahotas做的很好并且代碼量很少。下面是源碼:
8. SimpleITK
ITK 或者 Insight Segmentation and Registration Toolkit是一個開源的跨平臺系統(tǒng),為開發(fā)人員提供了一套廣泛的圖像分析軟件工具 。其中, SimpleITK是建立在ITK之上的簡化層,旨在促進(jìn)其在快速原型設(shè)計、教育、解釋語言中的應(yīng)用。SimpleITK 是一個圖像分析工具包,包含大量支持一般過濾操作、圖像分割和匹配的組件。SimpleITK本身是用C++寫的,但是對于包括Python以內(nèi)的大部分編程語言都是可用的。
資源
大量的Jupyter Notebooks 表明了SimpleITK在教育和研究領(lǐng)域已經(jīng)被使用。Notebook展示了用Python和R編程語言使用SimpleITK來進(jìn)行交互式圖像分析。
用法
下面的動畫是用SimpleITK和Python創(chuàng)建的剛性CT/MR匹配過程的可視化 。點擊此處可查看源碼!
9. pgmagick
pgmagick是GraphicsMagick庫的一個基于python的包裝。 GraphicsMagick圖像處理系統(tǒng)有時被稱為圖像處理的瑞士軍刀。它提供了一個具有強(qiáng)大且高效的工具和庫集合,支持以88種主要格式(包括重要格式,如DPX、GIF、JPEG、JPEG-2000、PNG、PDF、PNM和TIFF)讀取、寫入和操作圖像。
資源
有一個專門用于PgMagick的Github庫 ,其中包含安裝和需求說明。還有關(guān)于這個的一個詳細(xì)的用戶指導(dǎo):
用法
使用pgmagick可以進(jìn)行的圖像處理活動很少,比如:
圖像縮放
邊緣提取
10. Pycairo
Pycairo是圖像處理庫cairo的一組Python捆綁。Cairo是一個用于繪制矢量圖形的2D圖形庫。矢量圖形很有趣,因為它們在調(diào)整大小或轉(zhuǎn)換時不會失去清晰度 。Pycairo是cairo的一組綁定,可用于從Python調(diào)用cairo命令。
資源
Pycairo的GitHub庫是一個很好的資源,有關(guān)于安裝和使用的詳細(xì)說明。還有一個入門指南,其中有一個關(guān)于Pycairo的簡短教程。
庫:指南:用法
使用Pycairo繪制線條、基本形狀和徑向梯度:
總結(jié)
有一些有用且免費的Python圖像處理庫可以使用,有的是眾所周知的,有的可能對你來說是新的,試著多去了解它們。
Pillow是Python里的圖像處理庫(PIL:Python Image Library),提供了了廣泛的文件格式支持,強(qiáng)大的圖像處理能力,主要包括圖像儲存、圖像顯示、格式轉(zhuǎn)換以及基本的圖像處理操作等。
1)使用 Image 類
PIL最重要的類是 Image class, 你可以通過多種方法創(chuàng)建這個類的實例;你可以從文件加載圖像,或者處理其他圖像, 或者從 scratch 創(chuàng)建。
要從文件加載圖像,可以使用open( )函數(shù),在Image模塊中:
1
2
from PIL import Image
im = Image.open("E:/photoshop/1.jpg")
加載成功后,將返回一個Image對象,可以通過使用示例屬性查看文件內(nèi)容:
1
2
3
print(im.format, im.size, im.mode)
('JPEG', (600, 351), 'RGB')
format 這個屬性標(biāo)識了圖像來源。如果圖像不是從文件讀取它的值就是None。size屬性是一個二元tuple,包含width和height(寬度和高度,單位都是px)。 mode 屬性定義了圖像bands的數(shù)量和名稱,以及像素類型和深度。常見的modes 有 “L” (luminance) 表示灰度圖像, “RGB” 表示真彩色圖像, and “CMYK” 表示出版圖像。
如果文件打開錯誤,返回 IOError 錯誤。
只要你有了 Image 類的實例,你就可以通過類的方法處理圖像。比如,下列方法可以顯示圖像:
1
im.show()
2)讀寫圖像
PIL 模塊支持大量圖片格式。使用在 Image 模塊的 open() 函數(shù)從磁盤讀取文件。你不需要知道文件格式就能打開它,這個庫能夠根據(jù)文件內(nèi)容自動確定文件格式。要保存文件,使用 Image 類的 save() 方法。保存文件的時候文件名變得重要了。除非你指定格式,否則這個庫將會以文件名的擴(kuò)展名作為格式保存。
加載文件,并轉(zhuǎn)化為png格式:
1
2
3
4
5
6
7
8
9
10
11
12
13
"Python Image Library Test"
from PIL import Image
import os
import sys
for infile in sys.argv[1:]:
f,e = os.path.splitext(infile)
outfile = f +".png"
if infile != outfile:
try:
Image.open(infile).save(outfile)
except IOError:
print("Cannot convert", infile)
save() 方法的第二個參數(shù)可以指定文件格式。
3)創(chuàng)建縮略圖
縮略圖是網(wǎng)絡(luò)開發(fā)或圖像軟件預(yù)覽常用的一種基本技術(shù),使用Python的Pillow圖像庫可以很方便的建立縮略圖,如下:
1
2
3
4
5
6
7
# create thumbnail
size = (128,128)
for infile in glob.glob("E:/photoshop/*.jpg"):
f, ext = os.path.splitext(infile)
img = Image.open(infile)
img.thumbnail(size,Image.ANTIALIAS)
img.save(f+".thumbnail","JPEG")
上段代碼對photoshop下的jpg圖像文件全部創(chuàng)建縮略圖,并保存,glob模塊是一種智能化的文件名匹配技術(shù),在批圖像處理中經(jīng)常會用到。
注意:Pillow庫不會直接解碼或者加載圖像柵格數(shù)據(jù)。當(dāng)你打開一個文件,只會讀取文件頭信息用來確定格式,顏色模式,大小等等,文件的剩余部分不會主動處理。這意味著打開一個圖像文件的操作十分快速,跟圖片大小和壓縮方式無關(guān)。
4)圖像的剪切、粘貼與合并操作
Image 類包含的方法允許你操作圖像部分選區(qū),PIL.Image.Image.crop 方法獲取圖像的一個子矩形選區(qū),如:
1
2
3
4
# crop, paste and merge
im = Image.open("E:/photoshop/lena.jpg")
box = (100,100,300,300)
region = im.crop(box)
矩形選區(qū)有一個4元元組定義,分別表示左、上、右、下的坐標(biāo)。這個庫以左上角為坐標(biāo)原點,單位是px,所以上訴代碼復(fù)制了一個 200×200 pixels 的矩形選區(qū)。這個選區(qū)現(xiàn)在可以被處理并且粘貼到原圖。
1
2
region = region.transpose(Image.ROTATE_180)
im.paste(region, box)
當(dāng)你粘貼矩形選區(qū)的時候必須保證尺寸一致。此外,矩形選區(qū)不能在圖像外。然而你不必保證矩形選區(qū)和原圖的顏色模式一致,因為矩形選區(qū)會被自動轉(zhuǎn)換顏色。
5)分離和合并顏色通道
對于多通道圖像,有時候在處理時希望能夠分別對每個通道處理,處理完成后重新合成多通道,在Pillow中,很簡單,如下:
1
2
r,g,b = im.split()
im = Image.merge("RGB", (r,g,b))
對于split( )函數(shù),如果是單通道的,則返回其本身,否則,返回各個通道。
6)幾何變換
對圖像進(jìn)行幾何變換是一種基本處理,在Pillow中包括resize( )和rotate( ),如用法如下:
1
2
out = im.resize((128,128))
out = im.rotate(45) # degree conter-clockwise
其中,resize( )函數(shù)的參數(shù)是一個新圖像大小的元祖,而rotate( )則需要輸入順時針的旋轉(zhuǎn)角度。在Pillow中,對于一些常見的旋轉(zhuǎn)作了專門的定義:
1
2
3
4
5
out = im.transpose(Image.FLIP_LEFT_RIGHT)
out = im.transpose(Image.FLIP_TOP_BOTTOM)
out = im.transpose(Image.ROTATE_90)
out = im.transpose(Image.ROTATE_180)
out = im.transpose(Image.ROTATE_270)
7)顏色空間變換
在處理圖像時,根據(jù)需要進(jìn)行顏色空間的轉(zhuǎn)換,如將彩色轉(zhuǎn)換為灰度:
1
2
cmyk = im.convert("CMYK")
gray = im.convert("L")
8)圖像濾波
if rv is not None and rsv is not None:
# extract version/subversion
self._nmap_version_number = int(line[rv.start():rv.end()])
self._nmap_subversion_number = int(line[rsv.start()+1:rsv.end()])
break
}
基礎(chǔ)
你們可能家里都會有一些老照片已經(jīng)有黑點啊,劃痕啊等。你有想過修復(fù)它們么?我們不能簡單的在繪圖工具里把他們擦除了就完了。因為這樣只是把黑色的東西變成白色的而已,實際上沒用。在這種情況下,會用到一種技術(shù)叫圖像修復(fù)?;镜乃枷牒芎唵危河弥車南袼靥鎿Q壞掉的像素,這樣看上去就和周圍一樣了。比如下面這張:
很多算法被設(shè)計來干這個,OpenCV提供了兩個,可以用同一個函數(shù)來訪問: cv2.inpaint()
第一個算法是基于論文" An Image Inpainting Technique Based on the Fast Marching Method"。 是基于快速匹配方法的。假設(shè)圖像里的一個區(qū)域要修復(fù)。算法從這個區(qū)域的邊界開始,逐漸地進(jìn)入?yún)^(qū)域,把邊界內(nèi)的所有東西填充上。它取要修復(fù)的部分周圍的一個像素周圍的一小片鄰居。這個像素被周圍已知的像素的標(biāo)準(zhǔn)加權(quán)和替換掉。選擇權(quán)重是很重要的。要修復(fù)的點周圍像素的權(quán)重較高。和正常邊界近的,還有在邊界輪廓上的像素的權(quán)重較高。當(dāng)像素被修復(fù)以后,它會通過快速匹配方法(FMM)移動到最近的像素。FMM保證那些已知像素周圍的像素首先被修復(fù),所以這個就像人工啟發(fā)式的操作一樣。這個算法使用標(biāo)志cv2.INPAINT_TELEA開啟。
第二個算法基于論文" Navier-Stokes, Fluid Dynamics, and Image and Video Inpainting ".這個算法基于流體動力學(xué)和偏微分方程?;驹瓌t是啟發(fā)式。它首從已知區(qū)域先沿著邊緣到未知區(qū)域訪問(由于邊緣應(yīng)該是連續(xù)的)。在匹配邊要修復(fù)區(qū)域邊界的梯度向量時持續(xù)畫等值線(把相同亮度的點用線連起來,類似于輪廓線)。這時候用到流體動力學(xué)。之后會填充顏色以減小最小方差。這個算法用標(biāo)志cv2.INPAINT_NS啟用。
編碼
我們需要創(chuàng)建和輸入圖像相同大小的掩圖,需要修復(fù)的區(qū)域?qū)?yīng)的像素要非0.剩下的就簡單了。我的圖像被一些黑色劃痕給破壞了(實際上是我自己加的)。我用繪圖工具對應(yīng)的標(biāo)記出來。
看下面的結(jié)果。第一個圖片是輸入圖像,第二個是掩圖,第三個是用第一種算法的結(jié)果,最后一張是第二種算法的結(jié)果。
END
Python圖像處理是一種簡單易學(xué),功能強(qiáng)大的解釋型編程語言,它有簡潔明了的語法,高效率的高層數(shù)據(jù)結(jié)構(gòu),能夠簡單而有效地實現(xiàn)面向?qū)ο缶幊?,下文進(jìn)行對Python圖像處理進(jìn)行說明。
當(dāng)然,首先要感謝“戀花蝶”,是他的文章“用Python圖像處理 ” 幫我堅定了用Python和PIL解決問題的想法,對于PIL的一些介紹和基本操作,可以看看這篇文章。我這里主要是介紹點我在使用過程中的經(jīng)驗。
PIL可以對圖像的顏色進(jìn)行轉(zhuǎn)換,并支持諸如24位彩色、8位灰度圖和二值圖等模式,簡單的轉(zhuǎn)換可以通過Image.convert(mode)函數(shù)完 成,其中mode表示輸出的顏色模式。例如''L''表示灰度,''1''表示二值圖模式等。
但是利用convert函數(shù)將灰度圖轉(zhuǎn)換為二值圖時,是采用固定的閾 值127來實現(xiàn)的,即灰度高于127的像素值為1,而灰度低于127的像素值為0。為了能夠通過自定義的閾值實現(xiàn)灰度圖到二值圖的轉(zhuǎn)換,就要用到 Image.point函數(shù)。
深度剖析Python語法功能
深度說明Python應(yīng)用程序特點
對Python數(shù)據(jù)庫進(jìn)行學(xué)習(xí)研究
Python開發(fā)人員對Python經(jīng)驗之談
對Python動態(tài)類型語言解析
Image.point函數(shù)有多種形式,這里只討論Image.point(table, mode),利用該函數(shù)可以通過查表的方式實現(xiàn)像素顏色的模式轉(zhuǎn)換。其中table為顏色轉(zhuǎn)換過程中的映射表,每個顏色通道應(yīng)當(dāng)有256個元素,而 mode表示所輸出的顏色模式,同樣的,''L''表示灰度,''1''表示二值圖模式。
可見,轉(zhuǎn)換過程的關(guān)鍵在于設(shè)計映射表,如果只是需要一個簡單的箝位值,可以將table中高于或低于箝位值的元素分別設(shè)為1與0。當(dāng)然,由于這里的table并沒有什么特殊要求,所以可以通過對元素的特殊設(shè)定實現(xiàn)(0, 255)范圍內(nèi),任意需要的一對一映射關(guān)系。
示例代碼如下:
import Image # load a color image im = Image.open(''fun.jpg'') # convert to grey level image Lim = im.convert(''L'') Lim.save(''fun_Level.jpg'') # setup a converting table with constant threshold threshold = 80 table = [] for i in range(256): if i threshold: table.append(0) else: table.append(1) # convert to binary image by the table bim = Lim.point(table, ''1'') bim.save(''fun_binary.jpg'')
IT部分通常要完成的任務(wù)相當(dāng)繁重但支撐這些工作的資源卻很少,這已經(jīng)成為公開的秘密。任何承諾提高編碼效率、降低軟件總成本的IT解決方案都應(yīng)該進(jìn)行 周到的考慮。Python圖像處理所具有的一個顯著優(yōu)勢就是可以在企業(yè)的軟件創(chuàng)建和維護(hù)階段節(jié)約大量資金,而這兩個階段的軟件成本占到了軟件整個生命周期中總成本 的50%到95%。
Python清晰可讀的語法使得軟件代碼具有異乎尋常的易讀性,甚至對那些不是最初接觸和開發(fā)原始項目的程序員都 能具有這樣的強(qiáng)烈感覺。雖然某些程序員反對在Python代碼中大量使用空格。
不過,幾乎人人都承認(rèn)Python圖像處理的可讀性遠(yuǎn)勝于C或者Java,后兩 者都采用了專門的字符標(biāo)記代碼塊結(jié)構(gòu)、循環(huán)、函數(shù)以及其他編程結(jié)構(gòu)的開始和結(jié)束。提倡Python的人還宣稱,采用這些字符可能會產(chǎn)生顯著的編程風(fēng)格差 異,使得那些負(fù)責(zé)維護(hù)代碼的人遭遇代碼可讀性方面的困難。轉(zhuǎn)載