抓取頁(yè)面
成都創(chuàng)新互聯(lián)公司長(zhǎng)期為上千余家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營(yíng)造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為陜西企業(yè)提供專業(yè)的成都做網(wǎng)站、網(wǎng)站設(shè)計(jì),陜西網(wǎng)站改版等技術(shù)服務(wù)。擁有十余年豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。
地址:http://www.meipai.com/medias/hot
public function getContentByFilegetcontents($url) { $content = file_get_contents($url); return $content; }
然后我們會(huì)獲取到整個(gè)頁(yè)面的代碼,接下來(lái)就是從代碼中提取出視頻的地址 標(biāo)題 圖片等關(guān)鍵信息
2.提取
我們發(fā)現(xiàn)視頻的主要代碼集中在以下代碼中
通過正則匹配
public function extracturl($page) { $matches = array(); $voide=array(); $mainurl=""; $list=array(); $j=0; $pat = "/
全部代碼
.*?<\/li>/ism"; preg_match_all($pat, $page, $matches, PREG_PATTERN_ORDER); for ($i=0; $i(.*?)<\/strong>/ism"; preg_match_all($pat3, $matches[0][$i], $title, PREG_PATTERN_ORDER); $mytitle= $title[1][0]; $list[$j++]=array( 'voide'=>$myvoide, 'title'=>$mytitle, 'img'=>$myimg); } return $list; } } $url = "http://www.meipai.com/medias/hot"; $crawler = new Cutecrawler(); $content = $crawler->getContentByFilegetcontents($url); $c=$crawler->extracturl($content); var_dump($c); ?>
最后結(jié)果:
array(24) { [0]=> array(3) { ["voide"]=> string(51) "http://mvvideo2.meitudata.com/5737fd5caeb838981.mp4" ["title"]=> string(27) "老師那些年常說的話" ["img"]=> string(58) "/upload/otherpic60/108720.jpg!thumb320" } [1]=> array(3) { ["voide"]=> string(50) "http://mvvideo2.meitudata.com/5737fceabf873602.mp4" ["title"]=> string(21) "女友突然冷落你" ["img"]=> string(58) "http://mvimg2.meitudata.com/5736d25d0aa5d8991.jpg!thumb320" } [2]=> array(3) { ["voide"]=> string(51) "http://mvvideo2.meitudata.com/5737f300131e18596.mp4" ["title"]=> string(27) "女明星之間的內(nèi)心戲" ["img"]=> string(58) "/upload/otherpic60/108722.jpg!thumb320" } [3]=> array(3) { ["voide"]=> string(51) "http://mvvideo2.meitudata.com/5737eb9d0bfc92046.mp4" ["title"]=> string(24) "真替老師感到悲劇" ["img"]=> string(57) "/upload/otherpic60/108723.jpg!thumb320" }
接下來(lái)。。。你可以存入數(shù)據(jù)庫(kù)