你是想抓別人網(wǎng)頁上ajax動態(tài)載入的數(shù)據(jù)吧? 要找到它的ajax載入的URL地址 利用PHP的file_get_contents($url)函數(shù)讀取那個url地址。 對抓取到的內(nèi)容進(jìn)行分析或正則過濾。
目前創(chuàng)新互聯(lián)建站已為成百上千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、網(wǎng)站托管、服務(wù)器托管、企業(yè)網(wǎng)站設(shè)計、海棠網(wǎng)站維護(hù)等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
第一步,安裝并配置PHP集成環(huán)境,以phpstudy為例,見下圖,轉(zhuǎn)到下面的步驟。第二步,完成上述步驟后,在www目錄中創(chuàng)建一個新的html文件(newhtml)和一個php(ab.php)文件,見下圖,轉(zhuǎn)到下面的步驟。
可以通過瀏覽器的調(diào)試功能,例如Firefox按F12,點網(wǎng)絡(luò)標(biāo)簽,然后就可以看到網(wǎng)頁的所有數(shù)據(jù)信息,網(wǎng)頁通過AJAX異步加載的數(shù)據(jù)也可以得到。
甚至是登錄用cookie的擴(kuò)展有不少,Curl就是其中之一。
先獲取整個網(wǎng)頁的內(nèi)容,然后匹配到你說的數(shù)據(jù),嵌套到自己的網(wǎng)站,隔一段時間ajax運(yùn)行一次。
好像確實有太多這樣的工作,手工采集軟件里面的數(shù)據(jù),工作量很大、效率也不高,我們酒店已經(jīng)解決了,目前這種情況,用的比較多的是軟件機(jī)器人工具小幫,可以自動把攜程后臺訂單數(shù)據(jù)導(dǎo)出來,導(dǎo)出Excel或數(shù)據(jù)庫文件都可以。
照道理采集網(wǎng)頁數(shù)據(jù)有很多工具可以用,就像你說的,軟件本身導(dǎo)不出數(shù)據(jù),要拿到系統(tǒng)數(shù)據(jù)確實不容易。我之前也有類似的需求。你試試軟件機(jī)器人小幫,可以自動把攜程后臺訂單數(shù)據(jù)導(dǎo)出來,導(dǎo)出Excel或數(shù)據(jù)庫文件都可以。
爬攜程網(wǎng)的上的數(shù)據(jù),我嘗試編程爬過,最后沒搞定。
你這個問題現(xiàn)在應(yīng)該不少人都在找工具解決,用人工把數(shù)據(jù)拷貝出來確實也不太明智,我們酒店也有過這樣的問題,你試試軟件機(jī)器人小幫,就相當(dāng)于給軟件增加了一個批量導(dǎo)出數(shù)據(jù)的功能,具體導(dǎo)出什么數(shù)據(jù)你自己也可以選擇。
1、好像確實有太多這樣的工作,手工采集軟件里面的數(shù)據(jù),工作量很大、效率也不高,我們酒店已經(jīng)解決了,目前這種情況,用的比較多的是軟件機(jī)器人工具小幫,可以自動把攜程后臺訂單數(shù)據(jù)導(dǎo)出來,導(dǎo)出Excel或數(shù)據(jù)庫文件都可以。
2、照道理采集網(wǎng)頁數(shù)據(jù)有很多工具可以用,就像你說的,軟件本身導(dǎo)不出數(shù)據(jù),要拿到系統(tǒng)數(shù)據(jù)確實不容易。我之前也有類似的需求。你試試軟件機(jī)器人小幫,可以自動把攜程后臺訂單數(shù)據(jù)導(dǎo)出來,導(dǎo)出Excel或數(shù)據(jù)庫文件都可以。
3、現(xiàn)在這種一般都是用工具,我用的多的是軟件機(jī)器人工具小幫,可以自動采集導(dǎo)出攜程網(wǎng)后臺的訂單,不需要自己盯著復(fù)制粘貼,挺好用的。
4、這個問題其實也不難解決,很多公司就安排人,手工把數(shù)據(jù)復(fù)制粘貼出來,我之前也有類似的需求。你試試軟件機(jī)器人小幫,直接從用戶桌面采集后臺訂單數(shù)據(jù),采集速度和準(zhǔn)確性沒問題。不需要自己盯著復(fù)制粘貼,挺好用的。
5、這種工具叫采集器。但你不一定會用,這些工具也不一定支持你的網(wǎng)站。因此,或許需要量身定做。
6、要靠手動弄確實不容易,我之前也有類似的需求。最近也有一些新方法和技術(shù)出現(xiàn),我們酒店用的是軟件機(jī)器人小幫,可以自動把攜程后臺訂單數(shù)據(jù)導(dǎo)出來,導(dǎo)出Excel或數(shù)據(jù)庫文件都可以。不過,能不能滿足,還要你自己去了解。