?php
創(chuàng)新互聯(lián)專注于陽谷網(wǎng)站建設(shè)服務(wù)及定制,我們擁有豐富的企業(yè)做網(wǎng)站經(jīng)驗(yàn)。 熱誠為您提供陽谷營銷型網(wǎng)站建設(shè),陽谷網(wǎng)站制作、陽谷網(wǎng)頁設(shè)計(jì)、陽谷網(wǎng)站官網(wǎng)定制、小程序設(shè)計(jì)服務(wù),打造陽谷網(wǎng)絡(luò)公司原創(chuàng)品牌,更為您提供陽谷網(wǎng)站排名全網(wǎng)營銷落地服務(wù)。
/*
* 如下: 方法有點(diǎn)笨
* 抓取網(wǎng)頁內(nèi)容用 PHP 的正則
* 用JS每隔5分鐘刷新當(dāng)前頁面---即重新獲取網(wǎng)頁內(nèi)容
*
* 注: $mode中--title/title-更改為所需內(nèi)容(如 $mode = "#a(.*)/a#";獲取所有鏈接)
*
* window.location.href="";中的
* 更改為自己的URL----作用:即刷新當(dāng)前頁面
*
* setInterval("ref()",300000);是每隔300000毫秒(即 5 * 60 *1000 毫秒即5分鐘)執(zhí)行一次函數(shù) ref()
*
* print_r($arr);輸出獲得的所有內(nèi)容 $arr是一個(gè)數(shù)組 可根據(jù)所需輸出一部分(如 echo $arr[1][0];)
* 若要獲得所有內(nèi)容 可去掉
* $mode = "#title(.*)/title#";
if(preg_match_all($mode,$content,$arr)){
print_r($arr);
echo "br/";
echo $arr[1][0];
}
再加上 echo $content;
*/
$url = ""; //目標(biāo)站
$fp = @fopen($url, "r") or die("超時(shí)");
$content=file_get_contents($url);
$mode = "#title(.*)/title#";
if(preg_match_all($mode,$content,$arr)){
//print_r($arr);
echo "br/";
echo $arr[1][0];
}
?
script language="JavaScript" type="text/javascript"
--
function ref(){
window.location.href="";
}
setInterval("ref()",300000);
//--
/script
你是想抓別人網(wǎng)頁上ajax動(dòng)態(tài)載入的數(shù)據(jù)吧?
1、要找到它的ajax載入的URL地址
2、利用PHP的file_get_contents($url)函數(shù)讀取那個(gè)url地址。
3、對抓取到的內(nèi)容進(jìn)行分析或正則過濾。
如果你要
和
之間的所有源碼,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的
標(biāo)簽中的內(nèi)容,可以用preg_match_all //提取所有代碼 $pattern = '/
(.+?)
/is'; preg_match($pattern, $string, $match); //$match[0] 即為
和
之間的所有源碼 echo $match[0]; //然后再提取
之間的內(nèi)容 $pattern = '/(.+?)li/is'; preg_match_all($pattern, $match[0], $results); $new_arr=array_unique($results[0]); foreach($new_arr as $kkk){ echo $kkk; }