創(chuàng)新互聯(lián)www.cdcxhl.cn八線動態(tài)BGP香港云服務器提供商,新人活動買多久送多久,劃算不套路!
鳩江網(wǎng)站制作公司哪家好,找成都創(chuàng)新互聯(lián)公司!從網(wǎng)頁設計、網(wǎng)站建設、微信開發(fā)、APP開發(fā)、成都響應式網(wǎng)站建設公司等網(wǎng)站項目制作,到程序開發(fā),運營維護。成都創(chuàng)新互聯(lián)公司自2013年創(chuàng)立以來到現(xiàn)在10年的時間,我們擁有了豐富的建站經(jīng)驗和運維經(jīng)驗,來保證我們的工作的順利進行。專注于網(wǎng)站建設就選成都創(chuàng)新互聯(lián)公司。python讀取數(shù)據(jù)的方法?這個問題可能是我們?nèi)粘W習或工作經(jīng)常見到的。希望通過這個問題能讓你收獲頗深。下面是小編給大家?guī)淼膮⒖純?nèi)容,讓我們一起來看看吧!
不論是數(shù)據(jù)分析,數(shù)據(jù)可視化,還是數(shù)據(jù)挖掘,一切的一切全都是以數(shù)據(jù)作為最基礎的元素。利用Python進行數(shù)據(jù)分析,同樣最重要的一步就是如何將數(shù)據(jù)導入到Python中,然后才可以實現(xiàn)后面的數(shù)據(jù)分析、數(shù)據(jù)可視化、數(shù)據(jù)挖掘等。
在本期的Python學習中,我們將針對Python如何獲取外部數(shù)據(jù)做一個詳細的介紹:
讀取文本文件的數(shù)據(jù)
大家都知道,Python中pandas模塊是專門用來數(shù)據(jù)分析的一個強大工具,下面我們就來介紹pandas是如何讀取外部數(shù)據(jù)的。
In [1]: import pandas as pd In [2]: mydata_txt = pd.read_csv('C:\\test_code.txt',sep = '\t',encoding = 'utf-8')
對于中文的文本文件常容易因為編碼的問題而讀取失敗,正如上所示。遇到這樣的編碼問題該如何處置呢?解決辦法有兩種情況:
1)當原始文件txt或csv的數(shù)據(jù)不是uft8格式時,需要另存為utf8格式編碼;
2)如果原始的數(shù)據(jù)文件就是uft8格式,為了正常讀入,需要將read_csv函數(shù)的參數(shù)encoding設置為utf-8
將原始數(shù)據(jù)另存為utf8格式的數(shù)據(jù),重新讀入txt數(shù)據(jù)
In [3]: mydata_txt = pd.read_csv('C:\\test.txt',sep = '\t',encoding = 'utf-8') In [4]: mydata_txt
csv文本文件是非常常用的一種數(shù)據(jù)存儲格式,而且其存儲量要比Excel電子表格大很多,下面我們就來看看如何利用Python讀取csv格式的數(shù)據(jù)文件:
In [5]: mydata_csv = pd.read_csv('C:\\test.csv',sep = ',',encoding = 'utf-8') In [6]: mydata_csv
如果你善于總結(jié)的話,你會發(fā)現(xiàn),txt文件和csv文件均可以通過pandas模塊中的read_csv函數(shù)進行讀取。該函數(shù)有20多個參數(shù),類似于R中的read.table函數(shù),如果需要查看具體的參數(shù)詳情,可以查看幫助文檔:help(pandas.read_csv)。
讀取電子表格文件
這里所說的電子表格就是Excel表格,可以是xls的電子表格,也可以是xlsx的電子表格。在日常工作中,很多數(shù)據(jù)都是存放在Excel電子表格中的,如果我們需要使用Python對其進行分析或處理的話,第一步就是如何讀取Excel數(shù)據(jù)。下面我們來看看如果讀取Excel數(shù)據(jù)集:
In [7]: mydata_excel = pd.read_excel('C:\\test.xlsx',sep = '\t',encoding = 'utf-8') In [8]: mydata_excel
感謝各位的閱讀!看完上述內(nèi)容,你們對python讀取數(shù)據(jù)的方法大概了解了嗎?希望文章內(nèi)容對大家有所幫助。如果想了解更多相關文章內(nèi)容,歡迎關注創(chuàng)新互聯(lián)-成都網(wǎng)站建設公司行業(yè)資訊頻道。