在各種變量中保存的數(shù)據(jù)都是臨時的,隨著程序運行結(jié)束都會丟失。要做到數(shù)據(jù)長期有效,必須建立在磁盤中建立文件,將數(shù)據(jù)輸入到文件中并保存。需要獲取數(shù)據(jù)時需要打開文件讀取。
創(chuàng)新互聯(lián)公司是一家集網(wǎng)站建設(shè),沂源企業(yè)網(wǎng)站建設(shè),沂源品牌網(wǎng)站建設(shè),網(wǎng)站定制,沂源網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,沂源網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。
而我們自己建立的程序都是應(yīng)用程序,從本質(zhì)上講,應(yīng)用程序是無法直接操作計算機的硬件的,譬如讀寫磁盤中文件,這就需要調(diào)用操作系統(tǒng)中的相應(yīng)命令。接下來我們使用的Python內(nèi)置函數(shù)open()、write()都是通過調(diào)用操作系統(tǒng)的相關(guān)命令才實現(xiàn)文件讀寫的,至于其中的細節(jié),我們就不需要考慮了。
15.1創(chuàng)建和打開文件
在Python 中創(chuàng)建或打開文件,實際上是建立一個對象,該對象通過調(diào)用內(nèi)置的open()函數(shù)創(chuàng)建或打開一個文件。
語法:
file object = open(filename [, mode][, buffering])
參數(shù)說明如下:
filename:file_name變量是一個包含了你要訪問的文件名稱的字符串值;
mode:mode決定了打開文件的模式:只讀,寫入,追加等。所有可取值見如下的完全列表。這個參數(shù)是非強制的,默認文件訪問模式為只讀(r)。
Buffering:如果buffering的值被設(shè)為0,就不會有寄存;如果buffering的值取1,訪問文件時會寄存行;如果將buffering的值設(shè)為大于1的整數(shù),表明了這就是的寄存區(qū)的緩沖大小;如果取負值,寄存區(qū)的緩沖大小則為系統(tǒng)默認。
mode參數(shù)的參數(shù)值及說明
對于其中最難區(qū)別的r、r+、w、w+、a、a+幾個參數(shù)的區(qū)別總結(jié)如下,要特別注意指針的位置:
下面舉例說明open( )函數(shù)的使用方法。
例1:
file=open('1.py')
如果文件“1.py”存在,則可以打開此文件;如果文件“1.py”不存在,則會出現(xiàn)如下提示:
Traceback (most recent call last):
File " ", line 1, in
file=open('1.py')
FileNotFoundError: [Errno 2] No such file or directory: '1.py'
例2:
file=open('4.py',’a+’)
雖然文件“4.py”不存在,但運行并未出現(xiàn)錯誤,參見上表,“a+”的含義是以讀寫模式打開文件,如果該文件已經(jīng)存在,新內(nèi)容將以追加方式寫入;如果該文件不存在,則新建文件用于寫入。查看文件夾,發(fā)現(xiàn)已經(jīng)生成了一個新的文件4.py。
例3:
file=open('python.png','rb')
print(file)
運行結(jié)果:
這就是說,雖然Python可以打開一個圖片格式的文件,但print()并不能將其輸出,還需要第三方庫中模塊的相應(yīng)方法去處理,如PIL中的open()f方法。
例4:
file = open("f.txt", "w",encoding='utf-8')
# 以只寫模式打開文件f.txt,編碼方式為utf-8
print( "文件名: ", file.name) # 輸出文件名
print( "是否已關(guān)閉 : ", file.closed) # 文件是否打開
print( "訪問模式 : ", file.mode) # 文件訪問模式
運行結(jié)果:
文件名: f.txt
是否已關(guān)閉 : False
訪問模式 : w
例5:
15.2關(guān)閉文件
打開文件使用后要及時關(guān)閉,以免造成不必要的破壞,同時也可以釋放內(nèi)存。在Python中使用close()方法可以關(guān)閉文件。
語法格式:
file.close()
其中,file為文件對象。
15.3 with語句
with 語句適用于對資源進行訪問的場合,確保不管使用過程中是否發(fā)生異常都會執(zhí)行必要的“清理”操作,釋放資源,比如文件使用后自動關(guān)閉、線程中鎖的自動獲取和釋放等。
with語句的語法格式如下:
with expression as target:
with-body
其中,expression用于指定一個表達式,譬如打開文件的open()函數(shù)。target用于指定一個變量,并且將expression的結(jié)果保存到該變量中,譬如文件對象file。with-body用于指定with語句體,譬如一些文件操作的相關(guān)語句,如果沒有要執(zhí)行的語句體,則直接用pass語句代替。
假設(shè)python當(dāng)前目錄下存在一個test.txt文件,其內(nèi)容如下:
Python是一種解釋型語言: 這意味著開發(fā)過程中沒有了編譯這個環(huán)節(jié)。類似于PHP和Perl語言。
Python是交互式語言: 這意味著,您可以在一個 Python 提示符 后直接執(zhí)行代碼。
Python是面向?qū)ο笳Z言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對象的編程技術(shù)。
Python是初學(xué)者的語言:Python 對初級程序員而言,是一種偉大的語言,它支持廣泛的應(yīng)用程序開發(fā)。
舉例如下:
with open('test.txt','r',encoding='utf-8') as file:
line=file.readline() # readline()方法可以讀取文件一行數(shù)據(jù),接下來就會講到。
print(line)
運行結(jié)果如下:
Python是一種解釋型語言: 這意味著開發(fā)過程中沒有了編譯這個環(huán)節(jié)。類似于PHP和Perl語言。
而此時,我們給該段代碼with語句之外再增加一個讀取文件的語句,代碼如下:
with open('test.txt','r',encoding='utf-8') as file:
line=file.readline()
print(line)
line2=file.readline()
print(line2)
發(fā)現(xiàn)出現(xiàn)了如下錯誤提示:
Traceback (most recent call last):
File "C:/Users/zym/AppData/Local/Programs/Python/Python39/3.py", line 5, in
line2=file.readline()
ValueError: I/O operation on closed file.
意思是要讀取的文件已經(jīng)被關(guān)閉了。
由此可知,當(dāng)with語句運行結(jié)束后,被打開的test.txt文件就自動關(guān)閉了。
15.4讀取文件
在Python 中讀取文件的方法有:
1、讀取指定個數(shù)的字符
格式如下:
File.read([size])
其中,file為打開的文件對象。size為可選參數(shù),可以指定要讀取的字符個數(shù),省缺表示讀取所有內(nèi)容。
在調(diào)用read()方法讀取文件內(nèi)容時,文件必須是以r(只讀)或者r+(讀寫)方式打開。
如:
with open('test.txt','r',encoding='utf-8') as file:
txt=file.read() (或txt=file.read(10))
print(txt)
將讀取、輸出test.txt文件的全部內(nèi)容(或前10個字符)。
2、移動文件的指針
對于剛打開的文件,文件指針總是指向文件頭的。也可以通過seek()方法將文件的指針移動到新的位置。
格式如下:
file.seek(offset[,whence])
其中,file表示已經(jīng)打開的文件對象;offset用于指定移動的字符個數(shù);whence表示從哪個位置起始計算個數(shù),其值為0表示從文件頭開始計算,其值為1表示從當(dāng)前位置開始計算,其值為2表示從文件尾開始計算,默認值為0。
例如:
with open('test.txt','r',encoding='utf-8') as file:
string=file.read(9)
print('取9個字符: '+string)
file.seek(2) #指針從文件頭開始移動2個字符
string=file.read(9) #從當(dāng)前位置讀取10個字符
輸出結(jié)果:
取9個字符:
Python是一種
取9個字符:
thon是一種解釋
而下面的代碼會拋出錯誤:
with open('test.txt','r',encoding='utf-8') as file:
file.seek(2,1) #指針從當(dāng)前位置開始移動2個字符
string=file.read(10) #從當(dāng)前位置讀取10個字符
print('取10個字符: '+string)
錯誤提示為:
Traceback (most recent call last):
File "C:UserszymAppDataLocalProgramsPythonPython393.py", line 7, in
file.seek(2,1) #指針從當(dāng)前位置開始移動2個字符
io.UnsupportedOperation: can't do nonzero cur-relative seeks
原因在于,必須使用b模式(即rb)打開文件,才能使用whence參數(shù)。但是,b模式(二進制)不適合文本文件。對于test.txt這樣的文本文件,為了解決通過改變指針讀取任意位置字符,可以采用加一個位置變量的方法來存儲指針的值。
例如:
with open('test.txt','r',encoding='utf-8') as file:
#utf-8漢字與英文字符都占一個字符
string='' #設(shè)置一個空字符串
pointer=0 #當(dāng)前指針為0
str1=file.read(6) #讀取6個字符
pointer+=6 #指針變量后移6個字符
string+=str1 #string用來存放已讀取的字符
print('取6個字符: ',str1)
file.seek(pointer) #指針從文件頭開始移動2個字符
str1=file.read(8) #從當(dāng)前位置讀取10個字符
pointer+=8 #指針跳過已讀取的字符
string+=str1
print('再取8個字符: ',str1)
print('所有讀取的字符: ',string)
print('當(dāng)前指針所處的位置: ',pointer)
str1=file.read(1)
print('當(dāng)前指針所處的字符: ',str1)
運行結(jié)果如下:
取6個字符:
Python
再取8個字符:
是一種解釋型語言
所有讀取的字符:
Python是一種解釋型語言
當(dāng)前指針所處的位置:
14
當(dāng)前指針所處的字符:
:
3、讀取一行數(shù)據(jù)readline()方法
語法格式:
file.readline()
例:
with open('test.txt','r',encoding='utf-8') as f:
string=f.read(1) # 讀取文件的第一個字符
if string != '': # 防止文件為空文件
lineno=0
while True:
line=f.readline()
if line != '':
lineno+=1
print('第'+str(lineno)+'行:'+line,end='')
# 因為每行都有自帶的分行符,print()語句不允許換行
else:
break # 出現(xiàn)空行時停止讀取
else:
print('要讀取的文件為空文件!')
運行結(jié)果:
第1行:ython是一種解釋型語言: 這意味著開發(fā)過程中沒有了編譯這個環(huán)節(jié)。類似于PHP和Perl語言。
第2行:Python是交互式語言: 這意味著,您可以在一個 Python 提示符 后直接執(zhí)行代碼。
第3行:Python是面向?qū)ο笳Z言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對象的編程技術(shù)。
第4行:Python是初學(xué)者的語言:Python 對初級程序員而言,是一種偉大的語言,它支持廣泛的應(yīng)用程序開發(fā)。
4、讀取全部行命令readlines()方法
語法格式:
File.readlines()
該方法與read()方法一樣,在調(diào)用read()方法讀取文件內(nèi)容時,文件必須是以r(只讀)或者r+(讀寫)方式打開。
例:
with open('test.txt','r',encoding='utf-8') as f:
txt=f.readlines()
print(txt)
運行結(jié)果:
['Python是一種解釋型語言: 這意味著開發(fā)過程中沒有了編譯這個環(huán)節(jié)。類似于PHP和Perl語言。 ', 'Python是交互式語言: 這意味著,您可以在一個 Python 提示符 后直接執(zhí)行代碼。 ', 'Python是面向?qū)ο笳Z言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對象的編程技術(shù)。 ', 'Python是初學(xué)者的語言:Python 對初級程序員而言,是一種偉大的語言,它支持廣泛的應(yīng)用程序開發(fā)。 ']
從上面的運行結(jié)果可以看出,readlines()方法的返回值為一個字符串列表。所以,也可以以讀取列表元素的方法輸出。如下所示:
with open('test.txt','r',encoding='utf-8') as f:
txt=f.readlines()
for line in txt:
print(line,end='')
運行結(jié)果:
Python是一種解釋型語言: 這意味著開發(fā)過程中沒有了編譯這個環(huán)節(jié)。類似于PHP和Perl語言。
Python是交互式語言: 這意味著,您可以在一個 Python 提示符 后直接執(zhí)行代碼。
Python是面向?qū)ο笳Z言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對象的編程技術(shù)。
Python是初學(xué)者的語言:Python 對初級程序員而言,是一種偉大的語言,它支持廣泛的應(yīng)用程序開發(fā)。
15.5 寫入文件內(nèi)容
語法格式如下:
file.write(string)
其中,file為打開的文件對象,string為要寫入的字符串。
寫入文件內(nèi)容時,文件必須以w(可寫)或a(追加)模式打開。否則,會拋出如下異常提示:
Traceback (most recent call last):
File "C:UsersAdministratorAppDataLocalProgramsPythonPython383.py", line 2, in
f.write('人生苦短,我用Python!')
io.UnsupportedOperation: not writable
關(guān)于write()方法的用法舉例如下:
with open('test.txt','a',encoding='utf-8') as f:
f.write('人生苦短,我用Python!')
with open('test.txt','r',encoding='utf-8') as f:
txt=f.read()
print(txt)
運行結(jié)果:
Python是一種解釋型語言: 這意味著開發(fā)過程中沒有了編譯這個環(huán)節(jié)。類似于PHP和Perl語言。
Python是交互式語言: 這意味著,您可以在一個 Python 提示符 后直接執(zhí)行代碼。
Python是面向?qū)ο笳Z言: 這意味著Python支持面向?qū)ο蟮娘L(fēng)格或代碼封裝在對象的編程技術(shù)。
Python是初學(xué)者的語言:Python 對初級程序員而言,是一種偉大的語言,它支持廣泛的應(yīng)用程序開發(fā)。
人生苦短,我用Python!
可以看出,由于文件的打開方式為a模式(追加模式),寫入的內(nèi)容被寫入到文件的末尾。
在Python中,文件操作方法里沒有類似于字符串內(nèi)的計算長度、查找、替換、截取、分隔等方法,為什么沒有?原因可能是文件的類型太復(fù)雜,譬如說二進制文件,上述操作的意義不大。如果僅僅要對文本文件進行上述操作,完全可以先把文件的內(nèi)容讀取到字符串中,再用相應(yīng)的字符串函數(shù)或方法去操作就可以了。譬如,要將test.txt文件中的字符串‘Python’替換為’PHP’,則可以用如下代碼完成:
txt1=''
with open('test.txt','r',encoding='utf-8') as f:
txt1=f.read() #先將文件內(nèi)容存入字符串txt1中
txt2=txt1.replace('Python','PHP') #將txt1中的'Python'替換為'PHP',并存入txt2
with open('test.txt','w',encoding='utf-8') as f:
f.write(txt2) #將字符串txt2的內(nèi)容寫回到文件中
這里之所以分兩步打開文件(第一次為r模式,第二次為w模式),而沒有采用一次讀寫(r+、w+方式),因為那樣比較容易出錯。實踐證明,將文件的讀操作和寫操作分開其實是非常正確的選擇。
1 文件讀取全文本操作
在一定場景下我們需要把文本全部內(nèi)容讀取出來,進行處理。python提供三種函數(shù)讀取文件,分別是read readline readlines,
read():讀取文件的全部內(nèi)容,加上參數(shù)可以指定讀取的字符。
readline():讀取文件的一行。
readlines():讀取文件的所有行到內(nèi)存中。
不同場景下我們可以選擇不同函數(shù)對文件進行讀取。
1.1 方法一
file_name = input("請輸入你要打開的文件的完整路徑及名稱")
file= open(file_name, "r")
txt=file.read()
# 全文本的處理
file.close()
使用read函數(shù)將文件中的內(nèi)容全部讀取,放在字符串變量txt中。這樣操作適合于文本較小,處理簡單的情況,當(dāng)文件較大時,這種方式處理時不合適的。一次性讀取較大的文件到內(nèi)存中,會耗費較多的時間和資源。這時候分批處理效果更好。
1.2 方法二
file_name = input("請輸入你要打開的文件的完整路徑及名稱")
file= open(file_name, "r")
txt= file.read(4)
# 文本的處理while txt != ""txt= file.read(4)
# 批量文本處理
file.close()
這種方法適合于分批處理文本信息,每次批量讀入,批量處理,不會對內(nèi)存造成較大的壓力。
1.3 方法三
file_name = input("請輸入你要打開的文件的完整路徑及名稱")
file= open(file_name, "r")for line infile.readlines():
# 處理每一行數(shù)據(jù)
file.close()
這種處理方式適合處理以行為分割特點的文本,并且文本較小,因為這種處理方式需要一次性把文件所有內(nèi)容讀取到內(nèi)存中。
1.4 方法四
file_name = input("請輸入你要打開的文件的完整路徑及名稱")
file= open(file_name, "r") # 這里的file時文件句柄for line infile:
# 處理每一行數(shù)據(jù)
file.close()
這種方式和方法三中的區(qū)別是分行讀入,逐行處理,不會一次性把文件所有內(nèi)容都讀入到內(nèi)存中,對一些大文件的處理是很有效的。
2 文件寫入文本操作
文件寫入有兩種寫入函數(shù)和一種輔助支持。
write():向文件中寫入一個字符或者字節(jié)流
writelines():將一個元素全為字符串的列表寫入到文件中 需要注意的是,writelines寫入列表元素的時候會把列表元素的內(nèi)容拼接到一起寫入,不會有換行和空格 。
seek(): 輔助寫入函數(shù)offset偏移量參數(shù)代表含義如下
0 - 文件開頭
1 - 當(dāng)前位置
2 - 文件結(jié)尾
2.1 方法一
file_name = input("output.txt", "w+")
text= "hello world!"file_name.write(text)
file.close()
2.2 方法二
file_name = input("output.txt", "w+")
list= ["中午","早上","晚上"]
file_name.writelines(list)for line infile:
# 讀取寫入的數(shù)據(jù),這時候發(fā)現(xiàn)是沒有任何內(nèi)容的
file.close()
我們增加一行代碼就可以讀取到寫入的文件內(nèi)容,利用seek()函數(shù)調(diào)整寫操作指針的位置,可以實現(xiàn)寫操作之后的正常讀取。
file_name = input("output.txt", "w+")
list= ["中午","早上","晚上"]
file_name.readlines(list)
file_name.seek(0) # 調(diào)整寫的指針到文件的開始位置for line infile:
# 讀取寫入的數(shù)據(jù),這時候會讀出一行寫入的數(shù)據(jù)。
file.close()
/python通過解釋器內(nèi)置的open()函數(shù)打開一個文件,并實現(xiàn)該文件與一個程序變量的關(guān)聯(lián),open()函數(shù)格式如下:
/open()函數(shù)包含有兩個參數(shù):文件名和打開模式.當(dāng)文件與執(zhí)行文件在同一文件夾中,直接輸入文件名,亦可輸入文件的完整路徑.打開模式是指以何種方式打開文件,python提供了7種打開模式.
/r/w/x/a模式與b/t/+模式可以組合使用,比如'rt'為文本只讀.'rb'為二級制只讀.
/文件使用結(jié)束后,需要使用close()關(guān)閉文件使用權(quán)限,釋放內(nèi)存.
/當(dāng)文件使用文本格式打開時,讀寫按照字符串方式,采用計算機當(dāng)前編碼或指定編碼.
/當(dāng)文件以二進制方式打開時,讀寫按照字節(jié)流方式.
/python本身將文件讀取為一個行序列.
open(filepath) :打開文件
open(filepath,'r') :打開方式,默認是讀取
open(filepath).read() :讀取文件中的內(nèi)容
open(filepath).readline() :讀取文件中一行的內(nèi)容
open(filepath).readline()[1] :讀取文件中的內(nèi)容,返回值是列表。
open(filepath).close() :關(guān)閉文件
open(filepath).seek(0) :將光標回到首位
with open()函數(shù),不用close()方法,默認自動關(guān)閉,所以需要制定一些規(guī)則.
文件內(nèi)建函數(shù)和方法:
open() : 打開文件
read() :輸入
readline() :輸入一行
seek() :文件內(nèi)移動
write() :輸出
close() :關(guān)閉文件
writelines屬于python文件寫入操作的一個函數(shù)
文本寫入操作主要有兩個函數(shù),write(),writelines(),區(qū)別如下:
file.write(str)的參數(shù)是一個字符串,就是你要寫入文件的內(nèi)容.
file.writelines(sequence)的參數(shù)是序列,比如列表,它會迭代幫你寫入文件。
例 子:
#coding=utf-8
import?os
import?codecs
str_list?=?[
u'這里是第一行\(zhòng)n',
u'這里是第二行\(zhòng)n',
u'這里是第三行\(zhòng)n',
u'這里是第四行'
]
with?codecs.open('test.txt','w+',encoding='utf-8')?as?f:
f.writelines(str_list)