字段說(shuō)明:(標(biāo)有*的為必填字段,綠色值為默認(rèn)值)
創(chuàng)新互聯(lián)建站是創(chuàng)新、創(chuàng)意、研發(fā)型一體的綜合型網(wǎng)站建設(shè)公司,自成立以來(lái)公司不斷探索創(chuàng)新,始終堅(jiān)持為客戶提供滿意周到的服務(wù),在本地打下了良好的口碑,在過去的10多年時(shí)間我們累計(jì)服務(wù)了上千家以及全國(guó)政企客戶,如建筑動(dòng)畫等企業(yè)單位,完善的項(xiàng)目管理流程,嚴(yán)格把控項(xiàng)目進(jìn)度與質(zhì)量監(jiān)控加上過硬的技術(shù)實(shí)力獲得客戶的一致贊美。
*log_CateID:文章的分類ID
*log_Title:文章標(biāo)題
*log_Content:文章內(nèi)容
log_Tag:文章標(biāo)簽ID,格式為{標(biāo)簽ID},多個(gè)為{1}{2}{3}
log_Status:文章的狀態(tài),0為正常發(fā)布,1為草稿,2為審核
log_Type:文章的類別,0為文章,1為頁(yè)面
log_IsTop:文章是否置頂,0是不置頂,1是置頂
log_Intro:文章摘要,默認(rèn)是50字符
log_PostTime:文章發(fā)布時(shí)間,為UNIX時(shí)間戳,默認(rèn)當(dāng)前時(shí)間
log_ViewNums:文章瀏覽數(shù),默認(rèn)為0次
發(fā)表地址后綴:zb_users/plugin/QeeZer_Locoy/LocoyPost.php?locoy_key=火車頭自動(dòng)發(fā)布密令
火車頭采集器(V8.6為例)設(shè)置部分:
主要就是發(fā)布地址、post字段設(shè)置等,
第一步采集網(wǎng)址,下載好火車頭采集器后打開,新建一個(gè)任務(wù),任務(wù)名隨意。把需要采集的網(wǎng)站文章列表頁(yè)網(wǎng)址添加到起始網(wǎng)址。從圖中看出該列表頁(yè)有34頁(yè),每頁(yè)有N篇文章。
2
列表頁(yè)會(huì)一級(jí)網(wǎng)址,添加多級(jí)網(wǎng)址獲取,從而獲取二級(jí)網(wǎng)址(文章頁(yè)網(wǎng)址)
設(shè)置列表分頁(yè)獲取,3個(gè)地方分別是:分頁(yè)源代碼前面和后面還有中間位置。這一步用于獲取列表頁(yè)面鏈接,因?yàn)橛?4個(gè)列表頁(yè)面。設(shè)置完保存。
網(wǎng)址獲取選項(xiàng),這一步用于獲取列表頁(yè)上面文章頁(yè)的鏈接,根據(jù)自己需要設(shè)置需要截取的部分和根據(jù)網(wǎng)址的結(jié)構(gòu)設(shè)置包含與不包含某些字符。為空即沒限制,設(shè)置完保存。
設(shè)置好鏈接采集規(guī)則后,可以測(cè)試網(wǎng)址,看測(cè)試結(jié)果調(diào)整規(guī)則??磮D可以看到采集鏈接規(guī)則從起始鏈接到全面列表頁(yè)再到列表頁(yè)上的文章頁(yè)鏈接都已經(jīng)成功采集。
第二步是采集內(nèi)容,首先修改標(biāo)題規(guī)則,在頁(yè)面源代碼里面找到標(biāo)題的代碼,把標(biāo)題前后代碼負(fù)責(zé)過去截取出標(biāo)題。保存。
修改內(nèi)容采集規(guī)則,跟標(biāo)題規(guī)則差不多,也是源代碼里面找到內(nèi)容的前后代碼。這里內(nèi)容會(huì)有一些其他html標(biāo)簽,所以得添加一個(gè)html標(biāo)簽排除的規(guī)則。
完成后,測(cè)試看一下結(jié)果,從測(cè)試結(jié)果來(lái)調(diào)試規(guī)則,直到測(cè)試結(jié)果是自己想要的內(nèi)容為止。
第三步是采集導(dǎo)出。前面1、2兩步把規(guī)則設(shè)置好,最后就要把文章導(dǎo)出了。先做一個(gè)導(dǎo)出的模版。
然后選擇方式二,把每一篇文章都分別記錄到一個(gè)txt文本,保存位置自己選擇,模板選擇剛剛做好的導(dǎo)出模版.保存的文件名用文章標(biāo)題為命名。其他默認(rèn),保存。
把采集網(wǎng)址,采集內(nèi)容,發(fā)布3個(gè)選項(xiàng)框都勾選,然后開始采集。完成后文本就自動(dòng)生成在剛剛保存的文件夾里面了。
火車頭采集器采集文章教程到此就完成了,由于每個(gè)網(wǎng)站都是不一樣的,所以這里只能用一個(gè)網(wǎng)站演示,只是一個(gè)方法思路,自己采集文章還需要靈活變通。
軟件程序的獲取:
大家可以從百度中搜索“火車頭采集器”,并進(jìn)入對(duì)應(yīng)官方來(lái)獲取程序的最新版本下載地址。當(dāng)然也可以從小編所提供的網(wǎng)盤地址中獲取最新版本程序:
請(qǐng)點(diǎn)擊輸入圖片描述
請(qǐng)點(diǎn)擊輸入圖片描述
2
安裝并運(yùn)行“火車頭采集器”程序,在彈出的登陸界面中直接點(diǎn)擊“登陸”按鈕就可以以免費(fèi)版身份登陸。
請(qǐng)點(diǎn)擊輸入圖片描述
3
在程序主界面中,點(diǎn)擊“新建”下拉箭頭,從中選擇“任務(wù)”項(xiàng)。
請(qǐng)點(diǎn)擊輸入圖片描述
4
在彈出的窗口中,輸入“任務(wù)名”,同時(shí)點(diǎn)擊“起始網(wǎng)址”欄目右側(cè)的“添加”按鈕。
請(qǐng)點(diǎn)擊輸入圖片描述
5
接下來(lái)就極為重要的一步,就是對(duì)要進(jìn)行采集的網(wǎng)站進(jìn)行分板,對(duì)所采取的網(wǎng)站中各片文章的URL進(jìn)行綜合分析并找出規(guī)律,最后按如圖進(jìn)行填寫。
請(qǐng)點(diǎn)擊輸入圖片描述
6
然后切換至“第二步:采集內(nèi)容規(guī)則”選項(xiàng)卡中,我們需要對(duì)網(wǎng)頁(yè)內(nèi)容進(jìn)行分板。在此以“搜狗瀏覽器”為例,右擊要進(jìn)行分析的網(wǎng)頁(yè),從彈出的菜單中選擇“審查元素”項(xiàng)。
請(qǐng)點(diǎn)擊輸入圖片描述
7
在“開發(fā)式模式”界面中,點(diǎn)擊“選擇頁(yè)面中的一個(gè)元素去透視”按鈕,接著點(diǎn)擊“標(biāo)題”內(nèi)容,此時(shí)就可以在“開發(fā)者”窗口中顯示標(biāo)題所對(duì)應(yīng)的標(biāo)簽,此例為“h2"。
請(qǐng)點(diǎn)擊輸入圖片描述
8
接下來(lái)在”采集內(nèi)容規(guī)則“界面中,點(diǎn)擊“添加”按鈕來(lái)添加“標(biāo)題”項(xiàng),或者直接雙擊“標(biāo)題”項(xiàng)進(jìn)行修改。在彈出的界面中,勾選”前后截取“,將設(shè)置前后輟分別為"h2“、”/h2".
請(qǐng)點(diǎn)擊輸入圖片描述
9
利用同樣的方法添加其它采集內(nèi)容的規(guī)則。
切換至“第三步:發(fā)布內(nèi)容設(shè)置”選項(xiàng)卡,勾選“啟用 方式二”,并進(jìn)行如圖設(shè)置。
請(qǐng)點(diǎn)擊輸入圖片描述
10
最后從任務(wù)列表中,勾選要采集的內(nèi)容,點(diǎn)擊“開始”按鈕就可以按規(guī)則采集網(wǎng)站中的網(wǎng)頁(yè)內(nèi)容啦。
請(qǐng)點(diǎn)擊輸入圖片描述
如果還有啥問題,請(qǐng)留言或者私信,如果回答的還算可以,請(qǐng)列為最佳答案
火車頭采集器火車采集器(LocoySpider) 是一個(gè)供各大主流文章系統(tǒng),論壇系統(tǒng)等使用的多線程內(nèi)容采集發(fā)布程序。使用火車采集器,你可以瞬間建立一個(gè)擁有龐大內(nèi)容的網(wǎng)站。系統(tǒng)支持遠(yuǎn)程圖片下載,圖片批量水印,F(xiàn)lash下載,下載文件地址探測(cè),自制作發(fā)表的cms模塊參數(shù),自定義發(fā)表的內(nèi)容等。此外,豐富的規(guī)則制定,內(nèi)容替換功能,對(duì)Access,Mysql,MSsql的數(shù)據(jù)入庫(kù)導(dǎo)出的支持,更可令你采集內(nèi)容的時(shí)候得心應(yīng)手,現(xiàn)在開始你可以拋棄過去重復(fù)乏味的手工添加工作了,請(qǐng)馬上開始體驗(yàn)瞬間建站的樂趣吧!
火車采集器(LocoySpider)是一款功能強(qiáng)大且易于上手的專業(yè)采集軟件,強(qiáng)大的內(nèi)容采集和數(shù)據(jù)導(dǎo)入功能能將您采集的任何網(wǎng)頁(yè)數(shù)據(jù)發(fā)布到遠(yuǎn)程服務(wù)器,自定義用戶cms系統(tǒng)模塊,不管你的網(wǎng)站是什么系統(tǒng),都有可能使用上火車采集器,系統(tǒng)自帶的模塊文件支持:風(fēng)訊文章,動(dòng)易文章,動(dòng)網(wǎng)論壇,PHPWIND論壇,Discuz論壇,phpcms文章,phparticle文章,LeadBBS論壇,魔力論壇,Dedecms文章,Xydw文章,驚云文章等的模塊文件。更多cms模塊請(qǐng)自己參照制作修改,也可到官方網(wǎng)站與大家交流制作。 同時(shí)您也可以使用系統(tǒng)的數(shù)據(jù)導(dǎo)出功能,利用系統(tǒng)內(nèi)置標(biāo)簽,將采集到的數(shù)據(jù)對(duì)應(yīng)表的字段導(dǎo)出到本地任何一款A(yù)ccess,MySql,MS SqlServer內(nèi)。
LocoySpider采用Visual C#編寫,可獨(dú)立在Windows2008下運(yùn)行(windows2003 自帶點(diǎn)虐 1.1框架。最新版的火車采集器是2008版,需要升級(jí)到點(diǎn)虐 2.0框架才能使用),如您在Windows2000、Xp等環(huán)境下使用,請(qǐng)先到微軟官方下載一個(gè)點(diǎn)虐 framework2.0或更高環(huán)境組件。