本文章向大家介紹使用python怎么讀取文本中的數(shù)據(jù)的基本知識點總結(jié)和需要注意事項,具有一定的參考價值,需要的朋友可以參考一下。
成都創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),七星關(guān)區(qū)企業(yè)網(wǎng)站建設(shè),七星關(guān)區(qū)品牌網(wǎng)站建設(shè),網(wǎng)站定制,七星關(guān)區(qū)網(wǎng)站建設(shè)報價,網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,七星關(guān)區(qū)網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力。可充分滿足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。Python主要應(yīng)用于:1、Web開發(fā);2、數(shù)據(jù)科學研究;3、網(wǎng)絡(luò)爬蟲;4、嵌入式應(yīng)用開發(fā);5、游戲開發(fā);6、桌面應(yīng)用開發(fā)。
從純文本格式文件 “file_in”中讀取數(shù)據(jù),格式如下:
需要輸出成“file_out”,格式如下:
數(shù)據(jù)的原格式是“類別:內(nèi)容”,以空行“\n”為分條目,轉(zhuǎn)換后變成一個條目一行,按照類別順序依次寫出內(nèi)容。
建議讀取后,使用pandas,把數(shù)據(jù)建立稱DataFrame的表格。這樣方便以后處理數(shù)據(jù)。但是原格式并不是通常的表格格式,所以要先做一些簡單的處理。
#coding:utf8 import sys from pandas import DataFrame #DataFrame通常來裝二維的表格 import pandas as pd #pandas是流行的做數(shù)據(jù)分析的包 #建立字典,鍵和值都從文件里讀出來。鍵是nam,age……,值是lili,jim…… dict_data={} #打開文件 with open('file_in.txt','r')as df: #讀每一行 for line in df: #如果這行是換行符就跳過,這里用'\n'的長度來找空行 if line.count('\n') == len(line): continue #對每行清除前后空格(如果有的話),然后用":"分割 for kv in [line.strip().split(':')]: #按照鍵,把值寫進去 dict_data.setdefault(kv[0],[]).append(kv[1]) #print(dict_data)看看效果 #這是把鍵讀出來成為一個列表 columnsname=list(dict_data.keys()) #建立一個DataFrame,列名即為鍵名,也就是nam,age…… frame = DataFrame(dict_data,columns=columnsname) #把DataFrame輸出到一個表,不要行名字和列名字 frame.to_csv('file_out0.txt',index=False,header=False)
以上就是小編為大家?guī)淼氖褂胮ython怎么讀取文本中的數(shù)據(jù)的全部內(nèi)容了,希望大家多多支持創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計公司!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機、免備案服務(wù)器”等云主機租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。