php中使用基于libcurl的curl函數(shù),可以對(duì)目標(biāo)url發(fā)起http請(qǐng)求并獲取返回的響應(yīng)內(nèi)容。通常的請(qǐng)求方式類似如下的代碼:
成都創(chuàng)新互聯(lián)長期為千余家客戶提供的網(wǎng)站建設(shè)服務(wù),團(tuán)隊(duì)從業(yè)經(jīng)驗(yàn)10年,關(guān)注不同地域、不同群體,并針對(duì)不同對(duì)象提供差異化的產(chǎn)品和服務(wù);打造開放共贏平臺(tái),與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為德宏州企業(yè)提供專業(yè)的成都做網(wǎng)站、網(wǎng)站制作,德宏州網(wǎng)站改版等技術(shù)服務(wù)。擁有十載豐富建站經(jīng)驗(yàn)和眾多成功案例,為您定制開發(fā)。
public function callFunction($url, $postData, $method, header='') { $maxRetryTimes = 3; $curl = curl_init(); /******初始化請(qǐng)求參數(shù)start******/ if(strtoupper($method) !== 'GET' && $postData){ curl_setopt($curl, CURLOPT_POSTFIELDS, json_encode($postData)); }elseif (strtoupper($method) === 'GET' && $postData){ $url .= '?'. http_build_query($postData); } /******初始化請(qǐng)求參數(shù)end******/ curl_setopt_array($curl, array( CURLOPT_URL => $url, CURLOPT_TIMEOUT => 10, CURLOPT_NOBODY => 0, CURLOPT_RETURNTRANSFER => 1 )); if(method == 'POST'){ curl_setopt($curl, CURLOPT_POST, true); } if(false == empty()){ curl_setopt($curl, CURLOPT_HTTPHEADER, $header); } $response = false; while(($response === false) && (--$maxRetryTimes > 0)){ $response = trim(curl_exec($curl)); } return $response; }
上面代碼中的這個(gè)$response是curl發(fā)起的這次http請(qǐng)求從$url獲取到的數(shù)據(jù),如果沒有在$header中通過range來指定要下載的大小,無論這個(gè)資源多大,那么都要請(qǐng)求完整的并返回的是這個(gè)URI的完整內(nèi)容。通常只用curl來請(qǐng)求求一些接口或者遠(yuǎn)程調(diào)用一個(gè)函數(shù)獲取數(shù)據(jù),,所以這個(gè)場景下CURLOPT_TIMEOUT這個(gè)參數(shù)很重要。
對(duì)于curl的使用場景不止訪問數(shù)據(jù)接口,還要對(duì)任意的url資源進(jìn)行檢測(cè)是否能提供正確的http服務(wù)。當(dāng)用戶填入的url是一個(gè)資源文件時(shí),例如一個(gè)pdf或者ppt之類的,這時(shí)候如果網(wǎng)絡(luò)狀況較差的情況下用curl請(qǐng)求較大的資源,將不可避免的出現(xiàn)超時(shí)或者耗費(fèi)更多的網(wǎng)絡(luò)資源。之前的策略是完全下載(curl會(huì)下載存儲(chǔ)在內(nèi)存中),請(qǐng)求完后檢查內(nèi)容大小,當(dāng)超過目標(biāo)值就把這個(gè)監(jiān)控的任務(wù)暫停。這樣事發(fā)后限制其實(shí)治標(biāo)不治本,終于客戶提出了新的需求,不能停止任務(wù)只下載指定大小的文件并返回md5值由客戶去校驗(yàn)正確性。
經(jīng)過了一些嘗試,解決了這個(gè)問題,記錄過程如下文。
1、嘗試使用 CURLOPT_MAXFILESIZE。
對(duì)php和libcurl的版本有版本要求,完全的事前處理,當(dāng)發(fā)現(xiàn)目標(biāo)大于設(shè)置時(shí),直接返回了超過大小限制的錯(cuò)誤而不去下載目標(biāo)了,不符合要求。
2、使用curl下載過程的回調(diào)函數(shù)。
參考http://php.net/manual/en/function.curl-setopt-array.php,最終使用了CURLOPT_WRITEFUNCTION參數(shù)設(shè)置了on_curl_write,該函數(shù)將會(huì)1s中被回調(diào)1次。
$ch = curl_init(); $options = array(CURLOPT_URL => 'http://www.php.net/', CURLOPT_HEADER => false, CURLOPT_HEADERFUNCTION => 'on_curl_header', CURLOPT_WRITEFUNCTION => 'on_curl_write' );
最終我的實(shí)現(xiàn)片段:
function on_curl_write($ch, $data) { $pid = getmypid(); $downloadSizeRecorder = DownloadSizeRecorder::getInstance($pid); $bytes = strlen($data); $downloadSizeRecorder->downloadData .= $data; $downloadSizeRecorder->downloadedFileSize += $bytes; // error_log(' on_curl_write '.$downloadSizeRecorder->downloadedFileSize." > {$downloadSizeRecorder->maxSize} \n", 3, '/tmp/hyb.log'); //確保已經(jīng)下載的內(nèi)容略大于最大限制 if (($downloadSizeRecorder->downloadedFileSize - $bytes) > $downloadSizeRecorder->maxSize) { return false; } return $bytes; //這個(gè)不正確的返回,將會(huì)報(bào)錯(cuò),中斷下載 "errno":23,"errmsg":"Failed writing body (0 != 16384)" }
DownloadSizeRecorder是一個(gè)單例模式的類,curl下載時(shí)記錄大小,實(shí)現(xiàn)返回下載內(nèi)容的md5等。
class DownloadSizeRecorder { const ERROR_FAILED_WRITING = 23; //Failed writing body public $downloadedFileSize; public $maxSize; public $pid; public $hasOverMaxSize; public $fileFullName; public $downloadData; private static $selfInstanceList = array(); public static function getInstance($pid) { if(!isset(self::$selfInstanceList[$pid])){ self::$selfInstanceList[$pid] = new self($pid); } return self::$selfInstanceList[$pid]; } private function __construct($pid) { $this->pid = $pid; $this->downloadedFileSize = 0; $this->fileFullName = ''; $this->hasOverMaxSize = false; $this->downloadData = ''; } /** * 保存文件 */ public function saveMaxSizeData2File(){ if(empty($resp_data)){ $resp_data = $this->downloadData; } $fileFullName = '/tmp/http_'.$this->pid.'_'.time()."_{$this->maxSize}.download"; if($resp_data && strlen($resp_data)>0) { list($headerOnly, $bodyOnly) = explode("\r\n\r\n", $resp_data, 2); $saveDataLenth = ($this->downloadedFileSize < $this->maxSize) ? $this->downloadedFileSize : $this->maxSize; $needSaveData = substr($bodyOnly, 0, $saveDataLenth); if(empty($needSaveData)){ return; } file_put_contents($fileFullName, $needSaveData); if(file_exists($fileFullName)){ $this->fileFullName = $fileFullName; } } } /** * 返回文件的md5 * @return string */ public function returnFileMd5(){ $md5 = ''; if(file_exists($this->fileFullName)){ $md5 = md5_file($this->fileFullName); } return $md5; } /** * 返回已下載的size * @return int */ public function returnSize(){ return ($this->downloadedFileSize < $this->maxSize) ? $this->downloadedFileSize : $this->maxSize; } /** * 刪除下載的文件 */ public function deleteFile(){ if(file_exists($this->fileFullName)){ unlink($this->fileFullName); } } }
curl請(qǐng)求的代碼實(shí)例中,實(shí)現(xiàn)限制下載大小
…… curl_setopt($ch, CURLOPT_WRITEFUNCTION, 'on_curl_write');//設(shè)置回調(diào)函數(shù) …… $pid = getmypid(); $downloadSizeRecorder = DownloadSizeRecorder::getInstance($pid); $downloadSizeRecorder->maxSize = $size_limit; …… //發(fā)起curl請(qǐng)求 $response = curl_exec($ch); …… //保存文件,返回md5 $downloadSizeRecorder->saveMaxSizeData2File(); //保存 $downloadFileMd5 = $downloadSizeRecorder->returnFileMd5(); $downloadedfile_size = $downloadSizeRecorder->returnSize(); $downloadSizeRecorder->deleteFile();
到這里,踩了一個(gè)坑。增加了on_curl_write后,$response會(huì)返回true,導(dǎo)致后面取返回內(nèi)容的時(shí)候異常。好在已經(jīng)實(shí)時(shí)限制了下載的大小,用downloadData來記錄了已經(jīng)下載的內(nèi)容,直接可以使用。
if($response === true){ $response = $downloadSizeRecorder->downloadData; }