每個系統(tǒng)模型都有自己的采集,無論是內(nèi)置的還是用戶自定義的系統(tǒng)模型,新聞系統(tǒng)有新聞系統(tǒng)采集,下載系統(tǒng)有下載系統(tǒng)采集等等。
目前創(chuàng)新互聯(lián)已為上1000+的企業(yè)提供了網(wǎng)站建設(shè)、域名、虛擬主機(jī)、網(wǎng)站托管、服務(wù)器租用、企業(yè)網(wǎng)站設(shè)計、德化網(wǎng)站維護(hù)等服務(wù),公司將堅(jiān)持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
采集常用技巧:
1、過濾文章內(nèi)容的鏈接:
廣告過濾正則設(shè)置:“,”
2、同上得出,過濾font之類的標(biāo)簽:
廣告過濾正則:“,”,其他依此類推。
3、同一鏈接的頁面如何重復(fù)采集:
到“管理采集節(jié)點(diǎn)”那清空節(jié)點(diǎn)即可重復(fù)采集已入庫的頁面。
4、采集內(nèi)容分頁正則說明:
如果是全部列表式,則只需看第一頁的頁面HTML代碼。
采集的一些特殊字段說明:
1、“下載地址正則”、“在線觀看地址正則”、“圖片集正則”。
說明:下面的兩個正則是分開的,并且是用“[!empirecms!]”格開。
下載地址正則 格式:地址正則([!–ecmsdownpathurl–])[!empirecms!]名稱正則([!–ecmsdownpathname–]) 說明:名稱正則可以不設(shè)置,由系統(tǒng)自己命名。 在線觀看地址正則 格式:地址正則([!–ecmsonlinepathurl–])[!empirecms!]名稱正則([!–ecmsonlinepathname–]) 說明:名稱正則可以不設(shè)置,由系統(tǒng)自己命名。 圖片集正則 格式:縮略圖([!–ecmsspicurl–])[!empirecms!]大圖([!–ecmsbpicurl–])[!empirecms!]名稱([!–ecmspicname–]) 說明:大圖與名稱正則可以不設(shè)置。2、只要字段“輸入表單顯示元素”是“圖片(img)”、“FLASH文件”、“文件(file)”均支持遠(yuǎn)程保存文件到本地。
3、“newstext”字段才支持遠(yuǎn)程保存內(nèi)容里的圖片和FLASH到本地。