def?download_poster_image(movie):???#定義一個下載圖片函數(shù)
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),新華企業(yè)網(wǎng)站建設(shè),新華品牌網(wǎng)站建設(shè),網(wǎng)站定制,新華網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,新華網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。
src?=?movie??#取出它的url
r?=?requests.get(src)???#去獲取這個url
fname?=?url.split('/')[-1]???#從url里面獲取這個文件名
with?open(fname,?'wb')?as?f:??#應(yīng)答的內(nèi)容寫進去并且使用二進制
f.write(s.content)
movie['poster-path']?=?fname
res?=?requests.get(url)
img_url?=?res.xpath('//img[@class="q-img-item"]/@src')
movie?=?img_url?
download_poster_image(movie)?#執(zhí)行函數(shù)
要使用python,必須先安裝python,一般是2.7版本以上,不管是在windows系統(tǒng),還是linux系統(tǒng),安裝都是非常簡單的。
要使用python進行各種開發(fā),就必須安裝對應(yīng)的庫。(推薦學(xué)習(xí):Python視頻教程)
這和matlab非常相似,只是matlab里面叫工具箱(toolbox),而python里面叫庫或包。安裝這些庫,一般都是使用pip來安裝。
使用python進行數(shù)字圖片處理,還得安裝Pillow包。雖然python里面自帶一個PIL(python images library), 但這個庫現(xiàn)在已經(jīng)停止更新了,所以使用Pillow, 它是由PIL發(fā)展而來的。
圖片的打開與顯示
雖然使用的是Pillow,但它是由PIL fork而來,因此還是要從PIL中進行import. 使用open()函數(shù)來打開圖片,使用show()函數(shù)來顯示圖片。
這種圖片顯示方式是調(diào)用操作系統(tǒng)自帶的圖片瀏覽器來打開圖片,有些時候這種方式不太方便,因此我們也可以使用另上一種方式,讓程序來繪制圖片。
這種方法雖然復(fù)雜了些,但推薦使用這種方法,它使用一個matplotlib的庫來繪制圖片進行顯示。matplotlib是一個專業(yè)繪圖的庫,相當于matlab中的plot,可以設(shè)置多個figure,設(shè)置figure的標題,甚至可以使用subplot在一個figure中顯示多張圖片。
python中保存圖片的方法:
1、使用io模塊的imsave(fname,arr)函數(shù)來保存生成的圖片。
第一個參數(shù)表示保存的路徑和名稱,第二個參數(shù)表示需要保存的數(shù)組變量。
示例:
2、使用plt.savefig()方法保存
你可以安裝python的第三方應(yīng)用?chartdirector,?如下面用python代碼生成多個曲線的png圖形,并可以自定義layout.
#!/usr/bin/python
from pychartdir import *
# The data for the line chart
data0 = [42, 49, 33, 38, 51, 46, 29, 41, 44, 57, 59, 52, 37, 34, 51, 56, 56, 60, 70,
76, 63, 67, 75, 64, 51]
data1 = [50, 55, 47, 34, 42, 49, 63, 62, 73, 59, 56, 50, 64, 60, 67, 67, 58, 59, 73,
77, 84, 82, 80, 84, 98]
data2 = [36, 28, 25, 33, 38, 20, 22, 30, 25, 33, 30, 24, 28, 15, 21, 26, 46, 42, 48,
45, 43, 52, 64, 60, 70]
# The labels for the line chart
labels = ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9", "10", "11", "12", "13",
"14", "15", "16", "17", "18", "19", "20", "21", "22", "23", "24"]
# Create an XYChart object of size 600 x 300 pixels, with a light blue (EEEEFF)
# background, black border, 1 pxiel 3D border effect and rounded corners
c = XYChart(600, 300, 0xeeeeff, 0x000000, 1)
c.setRoundedFrame()
# Set the plotarea at (55, 58) and of size 520 x 195 pixels, with white background.
# Turn on both horizontal and vertical grid lines with light grey color (0xcccccc)
c.setPlotArea(55, 58, 520, 195, 0xffffff, -1, -1, 0xcccccc, 0xcccccc)
# Add a legend box at (50, 30) (top of the chart) with horizontal layout. Use 9 pts
# Arial Bold font. Set the background and border color to Transparent.
c.addLegend(50, 30, 0, "arialbd.ttf", 9).setBackground(Transparent)
# Add a title box to the chart using 15 pts Times Bold Italic font, on a light blue
# (CCCCFF) background with glass effect. white (0xffffff) on a dark red (0x800000)
# background, with a 1 pixel 3D border.
c.addTitle("Application Server Throughput", "timesbi.ttf", 15).setBackground(
0xccccff, 0x000000, glassEffect())
# Add a title to the y axis
c.yAxis().setTitle("MBytes per hour")
# Set the labels on the x axis.
c.xAxis().setLabels(labels)
# Display 1 out of 3 labels on the x-axis.
c.xAxis().setLabelStep(3)
# Add a title to the x axis
c.xAxis().setTitle("Jun 12, 2006")
# Add a line layer to the chart
layer = c.addLineLayer2()
# Set the default line width to 2 pixels
layer.setLineWidth(2)
# Add the three data sets to the line layer. For demo purpose, we use a dash line
# color for the last line
layer.addDataSet(data0, 0xff0000, "Server #1")
layer.addDataSet(data1, 0x008800, "Server #2")
layer.addDataSet(data2, c.dashLineColor(0x3333ff, DashLine), "Server #3")
# Output the chart
c.makeChart("multiline.png")
PIL (Python Imaging Library)
Python圖像處理庫,該庫支持多種文件格式,提供強大的圖像處理功能。
PIL中最重要的類是Image類,該類在Image模塊中定義。
從文件加載圖像:
如果成功,這個函數(shù)返回一個Image對象?,F(xiàn)在你可以使用該對象的屬性來探索文件的內(nèi)容。
format 屬性指定了圖像文件的格式,如果圖像不是從文件中加載的則為 None 。
size 屬性是一個2個元素的元組,包含圖像寬度和高度(像素)。
mode 屬性定義了像素格式,常用的像素格式為:“L” (luminance) - 灰度圖, “RGB” , “CMYK”。
如果文件打開失敗, 將拋出IOError異常。
一旦你擁有一個Image類的實例,你就可以用該類定義的方法操作圖像。比如:顯示
( show() 的標準實現(xiàn)不是很有效率,因為它將圖像保存到一個臨時文件,然后調(diào)用外部工具(比如系統(tǒng)的默認圖片查看軟件)顯示圖像。該函數(shù)將是一個非常方便的調(diào)試和測試工具。)
接下來的部分展示了該庫提供的不同功能。
PIL支持多種圖像格式。從磁盤中讀取文件,只需使用 Image 模塊中的 open 函數(shù)。不需要提供文件的圖像格式。PIL庫將根據(jù)文件內(nèi)容自動檢測。
如果要保存到文件,使用 Image 模塊中的 save 函數(shù)。當保存文件時,文件名很重要,除非指定格式,否則PIL庫將根據(jù)文件的擴展名來決定使用哪種格式保存。
** 轉(zhuǎn)換文件到JPEG **
save 函數(shù)的第二個參數(shù)可以指定使用的文件格式。如果文件名中使用了一個非標準的擴展名,則必須通過第二個參數(shù)來指定文件格式。
** 創(chuàng)建JPEG縮略圖 **
需要注意的是,PIL只有在需要的時候才加載像素數(shù)據(jù)。當你打開一個文件時,PIL只是讀取文件頭獲得文件格式、圖像模式、圖像大小等屬性,而像素數(shù)據(jù)只有在需要的時候才會加載。
這意味著打開一個圖像文件是一個非??斓牟僮鳎粫芪募笮『蛪嚎s算法類型的影響。
** 獲得圖像信息 **
Image 類提供了某些方法,可以操作圖像的子區(qū)域。提取圖像的某個子區(qū)域,使用 crop() 函數(shù)。
** 復(fù)制圖像的子區(qū)域 **
定義區(qū)域使用一個包含4個元素的元組,(left, upper, right, lower)。坐標原點位于左上角。上面的例子提取的子區(qū)域包含300x300個像素。
該區(qū)域可以做接下來的處理然后再粘貼回去。
** 處理子區(qū)域然后粘貼回去 **
當往回粘貼時,區(qū)域的大小必須和參數(shù)匹配。另外區(qū)域不能超出圖像的邊界。然而原圖像和區(qū)域的顏色模式無需匹配。區(qū)域會自動轉(zhuǎn)換。
** 滾動圖像 **
paste() 函數(shù)有個可選參數(shù),接受一個掩碼圖像。掩碼中255表示指定位置為不透明,0表示粘貼的圖像完全透明,中間的值表示不同級別的透明度。
PIL允許分別操作多通道圖像的每個通道,比如RGB圖像。 split() 函數(shù)創(chuàng)建一個圖像集合,每個圖像包含一個通道。 merge() 函數(shù)接受一個顏色模式和一個圖像元組,然后將它們合并為一個新的圖像。接下來的例子交換了一個RGB圖像的三個通道。
** 分離和合并圖像通道 **
對于單通道圖像, split() 函數(shù)返回圖像本身。如果想處理各個顏色通道,你可能需要先將圖像轉(zhuǎn)為RGB模式。
resize() 函數(shù)接受一個元組,指定圖像的新大小。
rotate() 函數(shù)接受一個角度值,逆時針旋轉(zhuǎn)。
** 基本幾何變換 **
圖像旋轉(zhuǎn)90度也可以使用 transpose() 函數(shù)。 transpose() 函數(shù)也可以水平或垂直翻轉(zhuǎn)圖像。
** transpose **
transpose() 和 rotate() 函數(shù)在性能和結(jié)果上沒有區(qū)別。
更通用的圖像變換函數(shù)為 transform() 。
PIL可以轉(zhuǎn)換圖像的像素模式。
** 轉(zhuǎn)換顏色模式 **
PIL庫支持從其他模式轉(zhuǎn)為“L”或“RGB”模式,其他模式之間轉(zhuǎn)換,則需要使用一個中間圖像,通常是“RGB”圖像。
ImageFilter 模塊包含多個預(yù)定義的圖像增強過濾器用于 filter() 函數(shù)。
** 應(yīng)用過濾器 **
point() 函數(shù)用于操作圖像的像素值。該函數(shù)通常需要傳入一個函數(shù)對象,用于操作圖像的每個像素:
** 應(yīng)用點操作 **
使用以上技術(shù)可以快速地對圖像像素應(yīng)用任何簡單的表達式??梢越Y(jié)合 point() 函數(shù)和 paste 函數(shù)修改圖像。
** 處理圖像的各個通道 **
注意用于創(chuàng)建掩碼圖像的語法:
Python計算邏輯表達式采用短路方式,即:如果and運算符左側(cè)為false,就不再計算and右側(cè)的表達式,而且返回結(jié)果是表達式的結(jié)果。比如 a and b 如果a為false則返回a,如果a為true則返回b,詳見Python語法。
對于更多高級的圖像增強功能,可以使用 ImageEnhance 模塊中的類。
可以調(diào)整圖像對比度、亮度、色彩平衡、銳度等。
** 增強圖像 **
PIL庫包含對圖像序列(動畫格式)的基本支持。支持的序列格式包括 FLI/FLC 、 GIF 和一些實驗性的格式。 TIFF 文件也可以包含多個幀。
當打開一個序列文件時,PIL庫自動加載第一幀。你可以使用 seek() 函數(shù) tell() 函數(shù)在不同幀之間移動。
** 讀取序列 **
如例子中展示的,當序列到達結(jié)尾時,將拋出EOFError異常。
注意當前版本的庫中多數(shù)底層驅(qū)動只允許seek到下一幀。如果想回到前面的幀,只能重新打開圖像。
以下迭代器類允許在for語句中循環(huán)遍歷序列:
** 一個序列迭代器類 **
PIL庫包含一些函數(shù)用于將圖像、文本打印到Postscript打印機。以下是一個簡單的例子。
** 打印到Postscript **
如前所述,可以使用 open() 函數(shù)打開圖像文件,通常傳入一個文件名作為參數(shù):
如果打開成功,返回一個Image對象,否則拋出IOError異常。
也可以使用一個file-like object代替文件名(暫可以理解為文件句柄)。該對象必須實現(xiàn)read,seek,tell函數(shù),必須以二進制模式打開。
** 從文件句柄打開圖像 **
如果從字符串數(shù)據(jù)中讀取圖像,使用StringIO類:
** 從字符串中讀取 **
如果圖像文件內(nèi)嵌在一個大文件里,比如 tar 文件中??梢允褂肅ontainerIO或TarIO模塊來訪問。
** 從tar文檔中讀取 **
** 該小節(jié)不太理解,請參考原文 **
有些解碼器允許當讀取文件時操作圖像。通常用于在創(chuàng)建縮略圖時加速解碼(當速度比質(zhì)量重要時)和輸出一個灰度圖到激光打印機時。
draft() 函數(shù)。
** Reading in draft mode **
輸出類似以下內(nèi)容:
注意結(jié)果圖像可能不會和請求的模式和大小匹配。如果要確保圖像不大于指定的大小,請使用 thumbnail 函數(shù)。
Python2.7 教程 PIL
Python 之 使用 PIL 庫做圖像處理
來自
作者:小風(fēng)寒吶
鏈接:
來源:知乎
著作權(quán)歸作者所有。商業(yè)轉(zhuǎn)載請聯(lián)系作者獲得授權(quán),非商業(yè)轉(zhuǎn)載請注明出處。
首先我們讀取圖庫中所有圖片的名稱,保存在fileNames中。然后讀取Data.csv中所有數(shù)據(jù)。
提取出Data.csv的最后一列(一共10002列,第10001列說明該數(shù)字是什么數(shù)字,第10002列是圖片的名稱),也就是數(shù)據(jù)庫中存儲的所有圖片的名稱,存儲在item中。
將新加入圖庫的圖片名稱保存在newFileNames中。如果Data.csv為空,那么就直接令newFileNames
=
fileNames。也就是說如果數(shù)據(jù)庫中什么也沒有,那么圖庫中所有圖片都是新加入的。
如果Data.csv不為空,那么就將item里面的內(nèi)容與fileNames的內(nèi)容比較,如果出現(xiàn)了fileNames里面有的名稱item中沒有,那么就將這些名稱放進newFileNames中。如果item里有的名稱fileNames中沒有,那就不管。
也就是說,我令我們的數(shù)據(jù)庫只進不出。
現(xiàn)在我們得到了新加入圖庫的圖片的名稱newFileNames。
將newFileNames中的名稱的圖片帶入上一文中函數(shù)GetTrainPicture進行處理,得到了一個nx10001的矩陣,每一行代表一個新加入的圖片,前10000列是圖片向量,第10001列是該圖片的數(shù)字,保存在pic中。