使用python與caffe怎么改變通道順序?相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。
創(chuàng)新互聯(lián)服務緊隨時代發(fā)展步伐,進行技術革新和技術進步,經(jīng)過十余年的發(fā)展和積累,已經(jīng)匯集了一批資深網(wǎng)站策劃師、設計師、專業(yè)的網(wǎng)站實施團隊以及高素質售后服務人員,并且完全形成了一套成熟的業(yè)務流程,能夠完全依照客戶要求對網(wǎng)站進行做網(wǎng)站、網(wǎng)站制作、建設、維護、更新和改版,實現(xiàn)客戶網(wǎng)站對外宣傳展示的首要目的,并為客戶企業(yè)品牌互聯(lián)網(wǎng)化提供全面的解決方案。把通道放在前面:
image = cv2.imread(path + file) image = cv2.resize(image, (48, 48), interpolation=cv2.INTER_CUBIC) aaaa= np.transpose(image,(2, 0, 1)) print(aaaa)
圖像原來shape:(48, 48, 3),改之后shape:(3,48,48)
注意:reshape不能解決通道轉換問題
pycaffe做識別時通道轉換問題:
要注意一點的就是:Caffe中彩色圖像的通道是BGR格式,圖像存儲是【0,255】
1.caffe.io.load_image方式 view plai cop
image = caffe.io.load_image(image_file) #加載圖片
使用caffe.io.load_image()讀進來的是RGB格式和0~1(float)
所以在進行識別之前要在transformer中設置transformer.set_raw_scale('data',255)(縮放至0~255)
以及transformer.set_channel_swap('data',(2,1,0)(將RGB變換到BGR)
# python中將圖片存儲為[0, 1],而caffe中將圖片存儲為[0, 255],所以需要一個轉換 transformer.set_raw_scale('data', 255) # 縮放到[0,255]之間 transformer.set_channel_swap('data', (2,1,0)) #交換通道,將圖片由RGB變?yōu)锽GR(caffe中圖片是BGR格式,而原始格式是RGB,所以要轉化)
2.使用cv2.imread()來讀取圖片
cv2.imread()接口讀圖像,讀進來直接是BGR 格式and 0~255
所以不需要再縮放到【0,255】和通道變換【2,1,0】,不需要transformer.set_raw_scale('data',255)和transformer.set_channel_swap('data',(2,1,0))
3.使用PIL來讀取圖片
對于彩色圖像,不管其圖像格式是PNG,還是BMP,或者JPG,在PIL中,使用Image模塊的open()函數(shù)打開后,返回的圖像對象的模式都是“RGB”。而對于灰度圖像,不管其圖像格式是PNG,還是BMP,或者JPG,打開后,其模式為“L”。所以需要轉換格式,但不需要縮放到[0,255]
data = np.array(Image.open(self.dataRoot+img_list)) data = np.transpose(data,(2,0,1))#轉換通道 data[[0,2],...] = data[[2,0],...] #RGB→BGR
4.對于matlab來說
Caffe中的blobs格式是N*C*H*W,分別是數(shù)量Number,通道數(shù)Channel,以及寬度Height和寬度Width
而matlab中是先寬后高,即[w,h],圖像的通道是RGB
所以需要進行相應的轉換:
im_data = im (:,:,[3,2,1]) ; %RGB to BGR
im_data = permute(im_data, [2,1,3]); %旋轉高度和寬度
最后,分享一個Caffe的典型python識別代碼:
# -*- coding: utf-8 -*- """ Created on Sun May 28 16:00:47 2017 @author: fancp,#windows下CPU模式 """ import numpy as np import caffe import sys caffe_root = 'F:/Caffe' #########你自己的Caffe路徑 sys.path.insert(0, caffe_root + '/python') size = 227 #訓練的圖片尺寸 image_file = 'F:/.../.../nihao.jpg'#圖片路徑 model_def = 'F:/.../.../deploy.prototxt'#deploy模型文件位置 model_weights = 'F:/.../.../_iter_20000.caffemodel'#訓練完的模型位置 net = caffe.Net(model_def, model_weights, caffe.TEST) # 加載均值文件 mu = np.load(caffe_root + '/python/caffe/imagenet/ilsvrc_2012_mean.npy') ###caffe 自帶的文件 mu = mu.mean(1).mean(1) # average over pixels to obtain the mean (BGR) pixel values ###########################下面這5句等同與上面兩句,選擇其一################# #blob = caffe.proto.caffe_pb2.BlobProto() #mean_data = open( 'mean.binaryproto' , 'rb' ).read() #blob.ParseFromString(mean_data) #mu = np.array(caffe.io.blobproto_to_array(blob)) #mu = mu.mean(1).mean(1).mean(1) ############################################################################## #圖片預處理 transformer = caffe.io.Transformer({'data': net.blobs['data'].data.shape}) ##設定圖片的shape格式(1,3,227,227),大小由deploy 文件指定 # python讀取的圖片文件格式為H×W×K,需轉化為K×H×W transformer.set_transpose('data', (2,0,1)) #改變維度的順序,由原始圖片(227,227,3)變?yōu)?3,227,227) transformer.set_mean('data', mu) # 每個通道減去均值 # python中將圖片存儲為[0, 1],而caffe中將圖片存儲為[0, 255],所以需要一個轉換 transformer.set_raw_scale('data', 255) # 縮放到【0,255】之間 transformer.set_channel_swap('data', (2,1,0)) #交換通道,將圖片由RGB變?yōu)锽GR(caffe中圖片是BGR格式,而原始格式是RGB,所以要轉化) net.blobs['data'].reshape(1,3,size, size) # 將輸入圖片格式轉化為合適格式(與deploy文件相同) #上面這句,第一參數(shù):圖片數(shù)量 第二個參數(shù) :通道數(shù) 第三個參數(shù):圖片高度 第四個參數(shù):圖片寬度 image = caffe.io.load_image(image_file) #加載圖片 # 用上面的transformer.preprocess來處理剛剛加載圖片 net.blobs['data'].data[...] = transformer.preprocess('data', image) ### perform classification caffe.set_mode_cpu() output = net.forward() #print output output_prob = output['prob'][0].argmax() # 給出概率最高的是第幾類,需要自己對應到我們約定的類別去Python的優(yōu)點有哪些
1、簡單易用,與C/C++、Java、C# 等傳統(tǒng)語言相比,Python對代碼格式的要求沒有那么嚴格;2、Python屬于開源的,所有人都可以看到源代碼,并且可以被移植在許多平臺上使用;3、Python面向對象,能夠支持面向過程編程,也支持面向對象編程;4、Python是一種解釋性語言,Python寫的程序不需要編譯成二進制代碼,可以直接從源代碼運行程序;5、Python功能強大,擁有的模塊眾多,基本能夠實現(xiàn)所有的常見功能。
看完上述內(nèi)容,你們掌握使用python與caffe怎么改變通道順序的方法了嗎?如果還想學到更多技能或想了解更多相關內(nèi)容,歡迎關注創(chuàng)新互聯(lián)行業(yè)資訊頻道,感謝各位的閱讀!