前沿:
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來(lái)自于我們對(duì)這個(gè)行業(yè)的熱愛(ài)。我們立志把好的技術(shù)通過(guò)有效、簡(jiǎn)單的方式提供給客戶,將通過(guò)不懈努力成為客戶在信息化領(lǐng)域值得信任、有價(jià)值的長(zhǎng)期合作伙伴,公司提供的服務(wù)項(xiàng)目有:域名申請(qǐng)、網(wǎng)站空間、營(yíng)銷軟件、網(wǎng)站建設(shè)、利津網(wǎng)站維護(hù)、網(wǎng)站推廣。
如果你對(duì)火車頭一點(diǎn)都不知道,你還是去網(wǎng)上自學(xué)一點(diǎn)火車頭采集的知識(shí),我也不是什么大師,硬著頭皮寫的,至少能用,在這里我不會(huì)教你如何寫采集規(guī)則,因?yàn)閷懛ǚN類太多,你問(wèn)我我也不知道,火車頭相關(guān)文件夾里提供的發(fā)布接口內(nèi)置了馬甲發(fā)布文章,并且支持遠(yuǎn)程圖片抓取本地化,和發(fā)布文章時(shí)間設(shè)置(10-70分鐘隨機(jī))。用戶只需關(guān)注火車頭標(biāo)題和內(nèi)容即可,參數(shù)值標(biāo)題(title),內(nèi)容(content)。
第一步:站點(diǎn)設(shè)置里設(shè)置下火車頭免登錄發(fā)布接口的全局變量值:
第二步:將發(fā)布接口上傳覆蓋程序根目錄:
第三步:登錄火車頭軟件后導(dǎo)入發(fā)布模塊"
下圖更多處下拉--選擇導(dǎo)入:
導(dǎo)入后:
上圖中,數(shù)字1處填寫你在網(wǎng)站后臺(tái)設(shè)置的全局變量值。
2 處選擇 utf-8 編碼。
3 處填寫你網(wǎng)站域名,不要帶 反斜杠'/'.
4處選擇不需要登錄
5 處點(diǎn)擊獲取列表--選擇你需要入庫(kù)的分類
6 隨便給當(dāng)前這個(gè)發(fā)布模塊寫個(gè)名字,后續(xù)采集任務(wù)模塊會(huì)用到。
最后點(diǎn)擊保存配置按鈕。
---------
下面講解導(dǎo)入采集任務(wù):
新建任務(wù)分組后,在該分組下導(dǎo)入任務(wù)規(guī)則(導(dǎo)入任務(wù)至該分組):
選擇我們的采集任務(wù)規(guī)則(.ljobx文件):
下一步:雙擊規(guī)則項(xiàng)
點(diǎn)擊第三步:修改發(fā)布內(nèi)容設(shè)置
修改下你發(fā)布的分類:
最后保存即可:
然后右鍵開(kāi)始任務(wù)采集:
1、首先在采集列表頁(yè)的源碼中將帶有縮略圖的那部分源碼復(fù)制下來(lái),如圖:
2、查看網(wǎng)站的源碼,找到這行代碼,如圖:
3、打開(kāi)火車頭,進(jìn)入采集網(wǎng)址規(guī)則—添加多級(jí)網(wǎng)址采集規(guī)則,選中手動(dòng)填寫鏈接地址規(guī)則,并將第二步驟中選中的代碼粘貼進(jìn)去,如圖:
4、將代碼進(jìn)行如下修改:
5、改好后保存并進(jìn)行采集測(cè)試,如圖所示
6、然后再在采集內(nèi)容規(guī)則里進(jìn)行修改,選中“縮略圖”標(biāo)簽,打開(kāi),進(jìn)行內(nèi)容替換,如圖:
7、然后點(diǎn)擊文件下載,選中下載圖片,并填好縮略圖保存路徑及命名方式,如圖:
8、在“文件保存及部分高級(jí)設(shè)置”里設(shè)定縮略圖的保存盤符及其前綴,我設(shè)定為桌面,前綴為“./”,如圖:
9、我們保存后測(cè)試一下,一起順利,縮略圖順利采集下來(lái)了
不得不說(shuō)火車頭是有一定用處,但是個(gè)人覺(jué)得不怎么好用,光是寫那些采集規(guī)則,設(shè)定什么的就一大堆不明不白的東西。拿錢購(gòu)買嘛,一開(kāi)始那客服還很熱情的為你解答,一交完錢買下來(lái)了,寫規(guī)則,好了,有問(wèn)題要找客服解決,結(jié)果一拖再拖,弄了一個(gè)多月還沒(méi)弄好,整個(gè)網(wǎng)站的工作進(jìn)程全拖慢了,還不如自己辛苦點(diǎn)自己手動(dòng)寫文章,還采集啥啊~
言歸正傳,火車頭使用:新建站點(diǎn)—新建任務(wù)—填寫你要采集的網(wǎng)站文章列表—點(diǎn)下面的開(kāi)始測(cè)試網(wǎng)址—如果有采集到很多文章,看各個(gè)地址相同部分(如system/2012/03/07),點(diǎn)返回修改,把system/2012/03/07這部分加到“文章內(nèi)容必須包含”那里,再測(cè)試一下,就可以采集到3月7日的文章地址了—前面準(zhǔn)備好網(wǎng)址后接下來(lái)就是第二步的采集內(nèi)容規(guī)則了,點(diǎn)第二步,設(shè)定標(biāo)簽,一般采集包括標(biāo)題title/title、關(guān)鍵字meta name=keyword...、內(nèi)容div.../div,這些設(shè)置從你要采集的網(wǎng)站代碼上可以找到相應(yīng)的——采集頁(yè)面上的圖片,在第四步,“文件保存及高級(jí)設(shè)置”,選擇所有文件本地保存文件夾(這里是從頁(yè)面下載圖片存放的位置),然后下面有個(gè)FTP同步文件上傳的,填好服務(wù)器、用戶名、密碼什么的,文件上傳根目錄就是你網(wǎng)站服務(wù)器放置圖片的文件夾位置,你可以在服務(wù)器新建一個(gè)文件夾試試看,OK!到此為止,不過(guò)有一些網(wǎng)站寫了反采集代碼,有可能會(huì)被封IP,整體來(lái)說(shuō),個(gè)人不提倡使用火車頭采集器,還不如個(gè)人手動(dòng)來(lái)得實(shí)在,就算一天少發(fā)點(diǎn)也行,只要保證每天更新量、偽原創(chuàng)和原創(chuàng),一樣有很大效果。