*參數(shù)說明:
我們提供的服務(wù)有:成都做網(wǎng)站、成都網(wǎng)站設(shè)計(jì)、微信公眾號開發(fā)、網(wǎng)站優(yōu)化、網(wǎng)站認(rèn)證、武漢ssl等。為近1000家企事業(yè)單位解決了網(wǎng)站和推廣的問題。提供周到的售前咨詢和貼心的售后服務(wù),是有科學(xué)管理、有技術(shù)的武漢網(wǎng)站制作公司
* LabelUrl - 當(dāng)前采集的頁面的Url地址
*$LabelCookie - 當(dāng)前采集頁面,服務(wù)器返回的Cookie信息。
根據(jù)以上參數(shù)可以推斷,我們需要在$LabelArray['Html'] 中對原標(biāo)簽進(jìn)行處理
例如(替換):
插件中:
if( LabelArray['PageType']=="Content")
{
LabelArray['Html']);
}
else if( JsonData[initDataObj][goods][skus] as specs = normalPrice = groupPrice = skuId = shuxing = "";
foreach ( spec) {
spec[spec_key].'/spanspan:'. shuxing = spe;
}
shuxing.'/spanspan單價(jià):'. sku[groupPrice].'/spanspanskuId:'. LabelArray['Html']='test'. LabelArray['Html'];
}
遇到的坑:
測試時(shí)在else if( LabelArray['PageType']=="List")中處理
一個(gè)插件文件需要在對應(yīng)的配置中選擇才會(huì)執(zhí)行,例如插件有請求處理,結(jié)果處理,但是火車頭配置中至選了結(jié)果處理插件,則請求的部分不會(huì)執(zhí)行
字段說明:(標(biāo)有*的為必填字段,綠色值為默認(rèn)值)
*log_CateID:文章的分類ID
*log_Title:文章標(biāo)題
*log_Content:文章內(nèi)容
log_Tag:文章標(biāo)簽ID,格式為{標(biāo)簽ID},多個(gè)為{1}{2}{3}
log_Status:文章的狀態(tài),0為正常發(fā)布,1為草稿,2為審核
log_Type:文章的類別,0為文章,1為頁面
log_IsTop:文章是否置頂,0是不置頂,1是置頂
log_Intro:文章摘要,默認(rèn)是50字符
log_PostTime:文章發(fā)布時(shí)間,為UNIX時(shí)間戳,默認(rèn)當(dāng)前時(shí)間
log_ViewNums:文章瀏覽數(shù),默認(rèn)為0次
發(fā)表地址后綴:zb_users/plugin/QeeZer_Locoy/LocoyPost.php?locoy_key=火車頭自動(dòng)發(fā)布密令
火車頭采集器(V8.6為例)設(shè)置部分:
主要就是發(fā)布地址、post字段設(shè)置等,
1、我們先新建兩個(gè)標(biāo)簽,里面起始結(jié)束代碼不用填任何東西,只用于插件后面對其進(jìn)行賦值操作,保存數(shù)據(jù)。
這兩個(gè)標(biāo)簽名分別是:首圖,是否圖片新聞
2、復(fù)制PHP-demo.php文件,修改為 PHP-zhangthree01.php
以下為獲取第一張首圖和判斷是否圖片新聞的主要代碼,php文件見附件
function bodyfirstimg($body) {
$body = strtolower($body);
if ( preg_match("/img.*src=[\"](.*?)[\"].*?/", $body, $regs))
{ //使用正則獲取第一幅圖像地址
return $regs[1] ;
}
else
{
return '' ;
}
}
if($LabelArray['Html'])
{
$LabelArray['Html']='當(dāng)前頁面的網(wǎng)址為:'.$LabelUrl."\r\n頁面類型為:".$LabelArray['PageType']."\r\nCookies數(shù)據(jù)為:$LabelCookie\r\n接收到的數(shù)據(jù)是:".$LabelArray['Html'];
}
else
{
$LabelArray['首圖'] = bodyfirstimg($LabelArray['內(nèi)容']);
$LabelArray['是否圖片新聞'] = $LabelArray['首圖']==''?false:true;
}
該附件下載后解壓為PHP-zhangthree01.php放到程序下Plugins目錄
3、在插件配置那 考慮到采內(nèi)容后還可能下載圖片,所以選擇在保存時(shí)選擇此插件使用即可
4、以新浪新聞規(guī)則作為測試。
偽原創(chuàng)插件api目前用過就小發(fā)貓AI+的靠譜,一個(gè)基于人工智能的偽原創(chuàng)軟件,生成的內(nèi)容原創(chuàng)度比較高,而且有使用教程
1、修改火車頭的PHP環(huán)境
由于火車頭采集器軟件內(nèi)置的PHP環(huán)境有問題,在使用PHP插件之前需要先修改火車頭的PHP環(huán)境。修改的方法很簡單,打開火車頭網(wǎng)站采集軟件的安裝目錄“System/PHP”,找到php.ini文件打開,并找到如下代碼。
找到 php_curl.dll 把前面的分號去掉改成:
修改前:
;extension=php_curl.dll
修改后:
extension=php_curl.dll
也就是將最前面的分號“;”刪除并保存即可,這樣火車頭數(shù)據(jù)采集器就可以正常運(yùn)行這個(gè)PHP仿寫插件了。
2、插件要統(tǒng)一放到火車頭插件目錄
例如我本機(jī)是:D:\火車采集器V9\Plugins
問:這個(gè)插件主要功能是什么?
回答:火車頭是一個(gè)采集器。采集后,如果開了插件,會(huì)把采集到的內(nèi)容通過插件處理后再保存,我們的插件是偽原創(chuàng),所以采集的內(nèi)容會(huì)偽原創(chuàng)后保存。
3、調(diào)試方法
首先按原來的方式,先確保采集規(guī)則能正常運(yùn)行。
然后,在正常運(yùn)行的基礎(chǔ)上,選擇偽原創(chuàng)插件。