一、數(shù)據(jù)集介紹
我們提供的服務(wù)有:做網(wǎng)站、成都網(wǎng)站建設(shè)、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、鄂托克ssl等。為上1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的鄂托克網(wǎng)站制作公司點擊打開鏈接17_Category_Flower 是一個不同種類鮮花的圖像數(shù)據(jù),包含 17 不同種類的鮮花,每類 80 張該類鮮花的圖片,鮮花種類是英國地區(qū)常見鮮花。下載數(shù)據(jù)后解壓文件,然后將不同的花剪切到對應(yīng)的文件夾,如下圖所示:
每個文件夾下面有80個圖片文件。
二、使用的工具
首先是在tensorflow框架下,然后介紹一下用到的兩個庫,一個是os,一個是PIL。PIL(Python Imaging Library)是 Python 中最常用的圖像處理庫,而Image類又是 PIL庫中一個非常重要的類,通過這個類來創(chuàng)建實例可以有直接載入圖像文件,讀取處理過的圖像和通過抓取的方法得到的圖像這三種方法。
三、代碼實現(xiàn)
我們是通過TFRecords來創(chuàng)建數(shù)據(jù)集的,TFRecords其實是一種二進制文件,雖然它不如其他格式好理解,但是它能更好的利用內(nèi)存,更方便復(fù)制和移動,并且不需要單獨的標(biāo)簽文件(label)。
1、制作TFRecords文件
import os import tensorflow as tf from PIL import Image # 注意Image,后面會用到 import matplotlib.pyplot as plt import numpy as np cwd = 'D:\PyCharm Community Edition 2017.2.3\Work\google_net\jpg\\' classes = {'daffodil', 'snowdrop', 'lilyvalley', 'bluebell', 'crocus', 'iris', 'tigerlily', 'tulip', 'fritiuary', 'sunflower', 'daisy', 'coltsfoot', 'dandelion', 'cowslip', 'buttercup', 'windflower', 'pansy'} # 花為 設(shè)定 17 類 writer = tf.python_io.TFRecordWriter("flower_train.tfrecords") # 要生成的文件 for index, name in enumerate(classes): class_path = cwd + name + '\\' for img_name in os.listdir(class_path): img_path = class_path + img_name # 每一個圖片的地址 img = Image.open(img_path) img = img.resize((224, 224)) img_raw = img.tobytes() # 將圖片轉(zhuǎn)化為二進制格式 example = tf.train.Example(features=tf.train.Features(feature={ "label": tf.train.Feature(int64_list=tf.train.Int64List(value=[index])), 'img_raw': tf.train.Feature(bytes_list=tf.train.BytesList(value=[img_raw])) })) # example對象對label和image數(shù)據(jù)進行封裝 writer.write(example.SerializeToString()) # 序列化為字符串 writer.close()