如果你要
創(chuàng)新互聯(lián)是一家集網(wǎng)站建設,蘭山企業(yè)網(wǎng)站建設,蘭山品牌網(wǎng)站建設,網(wǎng)站定制,蘭山網(wǎng)站建設報價,網(wǎng)絡營銷,網(wǎng)絡優(yōu)化,蘭山網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強企業(yè)競爭力??沙浞譂M足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時我們時刻保持專業(yè)、時尚、前沿,時刻以成就客戶成長自我,堅持不斷學習、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實用型網(wǎng)站。
和
之間的所有源碼,用 preg_match 就可以,不用preg_match_all ,如果你要里面的所有的
標簽中的內(nèi)容,可以用preg_match_all //提取所有代碼 $pattern = '/
(.+?)
/is'; preg_match($pattern, $string, $match); //$match[0] 即為
和
之間的所有源碼 echo $match[0]; //然后再提取
之間的內(nèi)容 $pattern = '/(.+?)li/is'; preg_match_all($pattern, $match[0], $results); $new_arr=array_unique($results[0]); foreach($new_arr as $kkk){ echo $kkk; }
PHP Simple HTML DOM或者phpQuery可以直接取得某些div中的內(nèi)容,里面有幾個例子專門針對于網(wǎng)頁抓取,調(diào)整好抓取頻次,舍去已經(jīng)存在的數(shù)據(jù),你可以參考下
;id=57class=2
?php
//設置連接
$DBserver
=
"localhost";
$DBname
=
"數(shù)據(jù)庫";
$DBuser
=
"賬號";
$DBpassword
=
"密碼";
$con
=
mysql_connect("localhost","賬號","密碼");
mysql_select_db("數(shù)據(jù)庫");
$contents
=
file_get_contents($url);
//$contents就是網(wǎng)頁內(nèi)容,$url就是鏈接
$contents
=
mysql_real_escape_string($contents);
//轉(zhuǎn)義,不用可以不要
$SQL="
INSERT
INTO
數(shù)據(jù)庫表(數(shù)據(jù)字段)
VALUES('{$contents}')";
mysql_query($SQL)
or
die(mysql_error());
?
你是想抓別人網(wǎng)頁上ajax動態(tài)載入的數(shù)據(jù)吧? 1、要找到它的ajax載入的URL地址 2、利用PHP的file_get_contents($url)函數(shù)讀取那個url地址。 3、對抓取到的內(nèi)容進行分析或正則過濾。