1.首先,題主應(yīng)該選一個相似度的計算維度,比如content字段,type字段等;
目前創(chuàng)新互聯(lián)公司已為成百上千家的企業(yè)提供了網(wǎng)站建設(shè)、域名、網(wǎng)站空間、網(wǎng)站托管運營、企業(yè)網(wǎng)站設(shè)計、離石網(wǎng)站維護(hù)等服務(wù),公司將堅持客戶導(dǎo)向、應(yīng)用為本的策略,正道將秉承"和諧、參與、激情"的文化,與客戶和合作伙伴齊心協(xié)力一起成長,共同發(fā)展。
2.其次,題主考慮一下各個字段的權(quán)重,比如type字段必須相同,則讓type字段使用typeWeight(例如賦值0.8)作為乘積的因子,而content字段本身是比較長的,所以需要計算出一個hash值,比如使用特定算法計算出一個hash值,然后把這個hash值按照16進(jìn)制計算得到10進(jìn)制數(shù),再給一個權(quán)重contentWeight(例如0.2),另外再選取一個字段,比如description描述字段,再給一個權(quán)重descriptionWeight...
3.最后得到一個當(dāng)前插入到表中的記錄綜合hash,typeWeight(contentHashcontentWeight+descriptionHash*descriptionWeight
+...),可能會涉及到大整數(shù)計算,不過PHP有BCMATH擴展可以使用,最終得到一個數(shù)值的綜合hash值,保存到數(shù)據(jù)庫的一個字段中,這個東西就可以理解為本條記錄的特征值。
?php
$text = "aa;aa;xx;aa;aa;bb;cc;aa;aa";
$text .= ';';//字串末尾加上分號
preg_match_all ("/aa;/", $text, $out);//匹配aa;
echo count($out[0]);//結(jié)果在$out[0];中
關(guān)聯(lián)UID,你根據(jù)你的情況做關(guān)聯(lián)即可。
?
很簡單
$str=file_get_contents('a.txt');//比如你存放IP的是a.txt
//$str='張山 123456 中國 192.168.1.1
// 李四 255454 美國 222.222.0.2
// ';
preg_match_all('/[0-9]{3}\.[0-9]{1,3}\.[0-9]{1,3}\.[0-9]{1,3}/',$str,$m);//匹配IP
print_r(array_count_values($m[0]));//打印出來的就是每個IP出現(xiàn)的次數(shù)
直接復(fù)制進(jìn)去 ,把a.txt改成你的文件名就行了。有問題追問我
$string="90pil8a94riqpaa";
$array1=str_split($string);
$array2=array_count_values($array1);
//用array_map();的回調(diào)函數(shù)
//還是foreach循環(huán)
//只要是元素的值大于1它的鍵值就是字符串中的重復(fù)值
//很簡單的多思考吧
先把字符串以一個字符為單位,轉(zhuǎn)換成數(shù)組
然后,數(shù)組去重array_unique
如果和之前的count不一樣,那么久是包含了重復(fù)相同的數(shù)字