本篇文章為大家展示了SCWS中怎么添加自定義詞典,內(nèi)容簡(jiǎn)明扼要并且容易理解,絕對(duì)能使你眼前一亮,通過(guò)這篇文章的詳細(xì)介紹希望你能有所收獲。
創(chuàng)新互聯(lián)建站致力于成都網(wǎng)站建設(shè)、做網(wǎng)站,成都網(wǎng)站設(shè)計(jì),集團(tuán)網(wǎng)站建設(shè)等服務(wù)標(biāo)準(zhǔn)化,推過(guò)標(biāo)準(zhǔn)化降低中小企業(yè)的建站的成本,并持續(xù)提升建站的定制化服務(wù)水平進(jìn)行質(zhì)量交付,讓企業(yè)網(wǎng)站從市場(chǎng)競(jìng)爭(zhēng)中脫穎而出。 選擇創(chuàng)新互聯(lián)建站,就選擇了安全、穩(wěn)定、美觀的網(wǎng)站建設(shè)服務(wù)!
require_once __DIR__.'/func/my_curl_function.php'; require_once __DIR__.'/func/simple_html_dom.php'; $url='http://www.xunsearch.com/scws/demo/get_tfidf.php'; $header=array( "Referer:http://www.xunsearch.com/scws/demo/get_tfidf.php", "Cookie:PHPSESSID=1fuk5j3ckb7n55s5j4cltk2sd3" ); $f= fopen('tfidf.txt','r'); $i=0; $html=new simple_html_dom(); while (!feof($f)) { sleep(1); $contents = array(); $contents = trim(fgets($f)); if($contents=="")continue; //echo $contents; $data['data']=urlencode(trim($contents)); $returndata=my_curl_post($url,$data,$header); //var_dump($returndata); //正則匹配出TF IDF preg_match('/WORD=.*? TF=(.*?) IDF=(.*?)
/',$returndata,$ret); $tf=$ret[1]; $idf=$ret[2]; echo "\n"; echo $contents."\t".$tf."\t".$idf."\tn\r\n"; //$html->load($returndata); //$ps=$html->find('p'); //var_dump($ret); file_put_contents("tfidf.out",$contents."\t".$tf."\t".$idf."\tn\r\n",FILE_APPEND); } fclose($f);
生成好自己的字典后就可以添加了
其實(shí)只要添加$so->add_dict('路徑',詞典);即可.
function scws_text($string) { $so = scws_new(); $so->set_charset('utf8'); $so->set_ignore(true); $so->add_dict('/usr/local/scws/etc/dict.xdb',SCWS_XDICT_XDB); $so->add_dict('/usr/local/scws/etc/dict.utf8.xdb',SCWS_XDICT_XDB); $so->add_dict('/usr/local/scws/etc/mydict.txt',SCWS_XDICT_TXT); $so->send_text($string); $text =""; while ($tmp = $so->get_result()) { foreach($tmp as $key=>$value){ //print_r($tmp); //$tmp .= $tmp; $text .= $value['word']." "; } } //print_r($text); $so->close(); return $text; }
上述內(nèi)容就是SCWS中怎么添加自定義詞典,你們學(xué)到知識(shí)或技能了嗎?如果還想學(xué)到更多技能或者豐富自己的知識(shí)儲(chǔ)備,歡迎關(guān)注創(chuàng)新互聯(lián)行業(yè)資訊頻道。