先獲取整個(gè)網(wǎng)頁(yè)的內(nèi)容,然后匹配到你說(shuō)的數(shù)據(jù),嵌套到自己的網(wǎng)站,隔一段時(shí)間ajax運(yùn)行一次。
站在用戶的角度思考問(wèn)題,與客戶深入溝通,找到鄯善網(wǎng)站設(shè)計(jì)與鄯善網(wǎng)站推廣的解決方案,憑借多年的經(jīng)驗(yàn),讓設(shè)計(jì)與互聯(lián)網(wǎng)技術(shù)結(jié)合,創(chuàng)造個(gè)性化、用戶體驗(yàn)好的作品,建站類型包括:網(wǎng)站設(shè)計(jì)、成都網(wǎng)站制作、企業(yè)官網(wǎng)、英文網(wǎng)站、手機(jī)端網(wǎng)站、網(wǎng)站推廣、國(guó)際域名空間、網(wǎng)頁(yè)空間、企業(yè)郵箱。業(yè)務(wù)覆蓋鄯善地區(qū)。
result[] = $arr[1];} //輸出測(cè)試,$result就是你要的數(shù)據(jù),至于你要怎么輸出顯示格式,那就隨心調(diào)就好了。
你是想抓別人網(wǎng)頁(yè)上ajax動(dòng)態(tài)載入的數(shù)據(jù)吧? 要找到它的ajax載入的URL地址 利用PHP的file_get_contents($url)函數(shù)讀取那個(gè)url地址。 對(duì)抓取到的內(nèi)容進(jìn)行分析或正則過(guò)濾。
jsp是服務(wù)器的語(yǔ)言,你只能抓取到它輸出到頁(yè)面的內(nèi)容。
訪問(wèn)需要采集的頁(yè)面,如果數(shù)據(jù)是用js輸出的html,那么必定有接口或者本身頁(yè)面中給js提供了數(shù)據(jù),來(lái)遍歷輸出html。
首先我們創(chuàng)建一個(gè)test的php文件。在里面添加html需要的代碼。我們?cè)诶锩嫣砑觠s腳本,定義一個(gè)a變量100?,F(xiàn)在我們?cè)诘撞刻砑觩hp中代碼,其中定義一個(gè)b變量默認(rèn)為0,準(zhǔn)備用它來(lái)接收js中的a的值。
PHP中并不能直接獲得JS的值,因?yàn)橐粋€(gè)運(yùn)行在客戶端,一個(gè)運(yùn)行在服務(wù)器端。
我可以很負(fù)責(zé)的告訴你,這是不可能的。PHP是在 服務(wù)器端 運(yùn)行的腳本,而JS是在瀏覽器運(yùn)行的腳本,你要調(diào)用可以,直接echo個(gè)script就可以,但是獲取 返回值 是不可能的,只有讓JS把返回值通過(guò)AJAX發(fā)送給PHP才可以。
語(yǔ)法: int sybase_connect(string [servername], string [username], string [password]);返回值: 整數(shù)函數(shù)種類: 數(shù)據(jù)庫(kù)功能 本函數(shù)用來(lái)打開(kāi)與 Sybase 數(shù)據(jù)庫(kù)的連接。參數(shù) servername 為欲連上的數(shù)據(jù)庫(kù)服務(wù)器名稱。
1、一般來(lái)說(shuō),PHP采集數(shù)據(jù)最簡(jiǎn)單的辦法是使用file_get_content函數(shù),功能更強(qiáng)大的推薦使用cURL函數(shù)庫(kù)。
2、參數(shù)可以由js產(chǎn)生并傳遞url,php后臺(tái)頁(yè)面根據(jù)URL抓頁(yè)面。然后ajax通過(guò)php,在數(shù)據(jù)庫(kù)或者是哪里設(shè)一個(gè)標(biāo)量,標(biāo)明檢測(cè)到哪里。由于前臺(tái)的html頁(yè)面執(zhí)行多少時(shí)候都沒(méi)問(wèn)題,這樣php的內(nèi)存限制和執(zhí)行時(shí)間限制就解決了。
3、使用php的file或者file_get_contents函數(shù),獲取鏈接URL的內(nèi)容。通過(guò)php正則表達(dá)式,獲取你需要的3個(gè)字段內(nèi)容。寫(xiě)入數(shù)據(jù)庫(kù)。需要注意的是,百度知道有可能做了防抓取的功能,你剛一抓幾個(gè)頁(yè)面,可能會(huì)被禁止。
4、strPreg = |]+([^]+)\/td\s*]+([^]+)\/td\s*]+([^]+)\/td|U搞定了才發(fā)現(xiàn)你都沒(méi)懸賞分。。
5、雖然我沒(méi)有做過(guò)采集在線詞典,不過(guò)看了下百度詞典,可以采集,給個(gè)參考思路。做一個(gè)本地的單詞庫(kù) php循環(huán)一條一條讀取詞語(yǔ)庫(kù) php采集 URL地址:百度詞典網(wǎng)址/s?wd=單詞,讀取html源碼php正則匹配內(nèi)容。
6、首先你的數(shù)據(jù)表中得有這個(gè)用戶的唯一標(biāo)識(shí),如用戶id=1。根據(jù)用戶id查詢所有匹配的數(shù)據(jù)。