你是想抓別人網(wǎng)頁上ajax動態(tài)載入的數(shù)據(jù)吧? 1、要找到它的ajax載入的URL地址 2、利用PHP的file_get_contents($url)函數(shù)讀取那個url地址。 3、對抓取到的內(nèi)容進(jìn)行分析或正則過濾。
在泗縣等地區(qū),都構(gòu)建了全面的區(qū)域性戰(zhàn)略布局,加強發(fā)展的系統(tǒng)性、市場前瞻性、產(chǎn)品創(chuàng)新能力,以專注、極致的服務(wù)理念,為客戶提供網(wǎng)站制作、成都做網(wǎng)站 網(wǎng)站設(shè)計制作按需開發(fā),公司網(wǎng)站建設(shè),企業(yè)網(wǎng)站建設(shè),品牌網(wǎng)站制作,全網(wǎng)營銷推廣,成都外貿(mào)網(wǎng)站建設(shè)公司,泗縣網(wǎng)站建設(shè)費用合理。
這是請求報頭中的Accept-Language的關(guān)系了。
這樣一來,你只是使用file_get_contents函數(shù)就實現(xiàn)不了這個功能了。
能夠模擬瀏覽器發(fā)送各種報頭,甚至是登錄用cookie的擴(kuò)展有不少,Curl就是其中之一。
你需要去網(wǎng)上去尋找相關(guān)的文章仔細(xì)了解一番,再做打算:
下面是PHP官網(wǎng)關(guān)于CURL擴(kuò)展的手冊:
【Client URL Library】
PHP Simple HTML DOM或者phpQuery可以直接取得某些div中的內(nèi)容,里面有幾個例子專門針對于網(wǎng)頁抓取,調(diào)整好抓取頻次,舍去已經(jīng)存在的數(shù)據(jù),你可以參考下
;id=57class=2