小編給大家分享一下解決python打開中文文件名亂碼的問題,相信大部分人都還不怎么了解,因此分享這邊文章給大家學(xué)習(xí),希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去學(xué)習(xí)方法吧!
在青山等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強(qiáng)發(fā)展的系統(tǒng)性、市場(chǎng)前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作 網(wǎng)站設(shè)計(jì)制作專業(yè)公司,公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),成都品牌網(wǎng)站建設(shè),營銷型網(wǎng)站,成都外貿(mào)網(wǎng)站建設(shè),青山網(wǎng)站建設(shè)費(fèi)用合理。
Python2默認(rèn)是不支持中文的,一般我們?cè)诔绦虻拈_頭加上#-*-coding:utf-8-*-來解決這個(gè)問題,但是在我用open()方法打開文件時(shí),中
文名字卻顯示成了亂碼。
我先給大家說說Python中的編碼問題,Python中的字符串的大概分為為str和Unicode兩種形式,其中str常用的編碼類型為utf-
8,gb2312,gbk等等,Python使用Unicode作為編碼的基礎(chǔ)類型。str記錄的是字節(jié)數(shù)組,只是某種編碼的存儲(chǔ)格式,終于輸出到文件或是
打印出來是什么格式,完全取決于其解碼的編碼將他解碼成什么樣子;Unicode是一種類似于符號(hào)集的抽象編碼,它只規(guī)定了符號(hào)的二進(jìn)
制代碼,卻沒有規(guī)定這個(gè)二進(jìn)制代碼該如何存儲(chǔ),也就是它只是一種內(nèi)部表示,不能直接保存,所以存儲(chǔ)時(shí)需要規(guī)定一種存儲(chǔ)形式,比如
utf-8等。
Python中有編碼轉(zhuǎn)換的函數(shù)有:
decode(char_set) 實(shí)現(xiàn)char_set解碼成Unicodeencode(char_set) 實(shí)現(xiàn)Unicode編碼成char_set
查看Python文檔會(huì)發(fā)現(xiàn):
open(filename, 'w')這個(gè)方法中,filename這個(gè)參數(shù)必須是Unicode編碼的參數(shù)。
我之前加上#-*-coding:utf-8-*-將編碼設(shè)置為utf-8,當(dāng)調(diào)用這個(gè)方法往里傳參數(shù)時(shí),需要將這個(gè)變量filename解碼成Unicode。
比如filename='中文.txt',使用open()時(shí),這樣寫open(filename.decode('utf-8'), 'w'),這樣創(chuàng)建的中文文件名就沒有亂碼問題了。
以上是解決python打開中文文件名亂碼的問題的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道!