前言
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對(duì)這個(gè)行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡(jiǎn)單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名注冊(cè)、網(wǎng)絡(luò)空間、營(yíng)銷軟件、網(wǎng)站建設(shè)、南召網(wǎng)站維護(hù)、網(wǎng)站推廣。上回說到我們?nèi)绾伟牙吹臄?shù)據(jù)抓取下來的,既然獲取了數(shù)據(jù),就別放著不動(dòng),把它拿出來分析一下,看看這些數(shù)據(jù)里面都包含了什么信息。
(本次博客源碼地址:https://github.com/MaxLyu/Lagou_Analyze (本地下載))
下面話不多說了,來一起看看詳細(xì)的介紹吧
一、前期準(zhǔn)備
由于上次抓的數(shù)據(jù)里面包含有 ID 這樣的信息,我們需要將它去掉,并且查看描述性統(tǒng)計(jì),確認(rèn)是否存在異常值或者確實(shí)值。
read_file = "analyst.csv" # 讀取文件獲得數(shù)據(jù) data = pd.read_csv(read_file, encoding="gbk") # 去除數(shù)據(jù)中無關(guān)的列 data = data[:].drop(['ID'], axis=1) # 描述性統(tǒng)計(jì) data.describe()
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時(shí)售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國(guó)服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡(jiǎn)單易用、服務(wù)可用性高、性價(jià)比高”等特點(diǎn)與優(yōu)勢(shì),專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場(chǎng)景需求。