這篇文章主要介紹PHP實現(xiàn)短網(wǎng)址的方法,文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!
讓客戶滿意是我們工作的目標(biāo),不斷超越客戶的期望值來自于我們對這個行業(yè)的熱愛。我們立志把好的技術(shù)通過有效、簡單的方式提供給客戶,將通過不懈努力成為客戶在信息化領(lǐng)域值得信任、有價值的長期合作伙伴,公司提供的服務(wù)項目有:國際域名空間、網(wǎng)頁空間、營銷軟件、網(wǎng)站建設(shè)、通川網(wǎng)站維護(hù)、網(wǎng)站推廣。1.背景介紹
相信很多人手機(jī)上都收到過一些營銷短信,短信里面有時候會附帶一些網(wǎng)址,如下圖
這些網(wǎng)址往往都是非常短,但是當(dāng)我們打開之后,如果你仔細(xì)觀察,中間會有跳轉(zhuǎn),最終瀏覽器地址欄顯示的網(wǎng)址并不是你短信里面看到的網(wǎng)址,這就是短網(wǎng)址!
2.原理和應(yīng)用
短網(wǎng)址一般是采用一個非常短域名下,路徑參數(shù)一般只有3-6個字符組成,非常簡潔!
使用短網(wǎng)址的前提是先生成短網(wǎng)址,主要是采用某種算法讓一段短的字符對應(yīng)一個長的字符,比如說從常用的0-9、a-z、A-Z共62個字符中選擇6個字符,那意味著有62的6次方種組合,大概有568億不重復(fù)的短網(wǎng)址可用!
服務(wù)器通過路徑參數(shù)查詢到真實的長網(wǎng)址,然后使用301/302跳轉(zhuǎn)到真實的網(wǎng)址即可!
關(guān)于跳轉(zhuǎn),301 是永久重定向,302 是臨時重定向。短地址一經(jīng)生成就不會變化,所以用 301 是符合 http 語義的,瀏覽器會記錄跳轉(zhuǎn)地址,同時對服務(wù)器壓力也會有一定減少。但是如果使用了 301,我們就無法統(tǒng)計到短地址被點擊的次數(shù)了,如果對數(shù)據(jù)統(tǒng)計有要求的話,使用302跳轉(zhuǎn)可能比較好一些!
短網(wǎng)址的主要好處是方便傳輸記憶,特別是在短信里面使用的時候,短信對內(nèi)容字?jǐn)?shù)有限制,還有比如說微博分享也使用了短網(wǎng)址!
3.市面現(xiàn)有案例
目前市面上有很多免費的短鏈接服務(wù),功能基本上都一樣,也沒有什么限制!
(1)百度的短鏈接(dwz.cn/),百度不僅僅提供了網(wǎng)頁入口,也提供了接口和開發(fā)文檔,簡單易用!
(2)新浪的短鏈接(sina.lt/),目前僅提供網(wǎng)頁入口,未發(fā)現(xiàn)接口服務(wù)!
(3)淘寶的短鏈接(tb.am/),目前僅提供網(wǎng)頁入口,未發(fā)現(xiàn)接口服務(wù)!
市面還有很多其它的小的公司提供短鏈接服務(wù),有些是部分免費,有些短鏈接是有效期的,這里不一一介紹!
4.常用算法
網(wǎng)上比較流行的算法有進(jìn)制算法、摘要(Hash)算法、隨機(jī)數(shù)算法,下面簡單介紹一下:
一.進(jìn)制算法
這個算法網(wǎng)上也有叫作自增序列算法,特點就是永不重復(fù),設(shè)置 id 自增,一個 10進(jìn)制 id 對應(yīng)一個62進(jìn)制的數(shù)值,1對1,也就不會出現(xiàn)重復(fù)的情況,這個利用的就是低進(jìn)制轉(zhuǎn)化為高進(jìn)制時,字符數(shù)會減少的特性。
計算機(jī)中常見的進(jìn)制有2進(jìn)制,8進(jìn)制,10進(jìn)制,16進(jìn)制,進(jìn)制越大,能夠表示的數(shù)越大,占用的字?jǐn)?shù)也越少。下面舉個例:
10進(jìn)制的1000,在8進(jìn)制里面是1750,在16進(jìn)制里面就是3E8,那在62進(jìn)制里面呢?有人說,計算機(jī)里面沒有62進(jìn)制。。。雖然沒有,但是我們可以造一個,進(jìn)制的轉(zhuǎn)換算法是固定的,最常見的就是“除基取余法”!
我們假設(shè)62進(jìn)制的字符序列為 0-9a-zA-Z,順序可以打亂,但是應(yīng)該固定下來,是一個從0角標(biāo)開始的到61的數(shù)組,我們暫且稱之為字母表!
====> 1000/62 = 16,余8
====> 16/62 = 0,余16
余數(shù)得到的數(shù)字是16、8,然后找到字母表里面角標(biāo)為16和8的字符拼起來,就是g8,非常短,只有2位數(shù)!假如說我們想至少產(chǎn)生6位字符,那么我們可以從一個比較大的數(shù)字開始,具體可以看下圖:
1位 62 0 - 61 2位 3844 62 - 3843 3位 約 23萬 3844 - 238327 4位 約 1400萬 238328 - 14776335 5位 約 9.1億 14776336 - 916132831 6位 約 568億 916132832 - 56800235583 復(fù)制代碼
二.Hash算法
第一種方式:
簡單的對長鏈接進(jìn)行加鹽md5,會生成一個32位的字符串,隨機(jī)從里面取6個字符,或者簡單粗暴取最后6位,但是md5只包含0-9A-Fa-f,比字母表的里面字符還少,沖突幾率更大!
第二種方式:
1.將長網(wǎng)址 md5 生成 32 位簽名串,分為 4 段, 每段 8 個字節(jié)
2.對這四段循環(huán)處理, 取 8 個字節(jié), 將他看成 16 進(jìn)制串與 0x3fffffff(30位1) 與操作, 即超過 30 位的忽略處理
3.這 30 位分成 6 段, 每 5 位的數(shù)字作為字母表的索引取得特定字符, 依次進(jìn)行獲得 6 位字符串
4.總的 md5 串可以獲得 4 個 6 位串,取里面的任意一個就可作為這個長 url 的短 url 地址
生成的方式更加復(fù)雜,重復(fù)的幾率低,但是依然會出現(xiàn)沖突!
三.隨機(jī)數(shù)算法
這個更簡單,直接對這個62個字符數(shù)組做隨機(jī)選擇,選擇其中6個字符當(dāng)作短鏈接碼,簡單易用,但是難免會出現(xiàn)重復(fù)沖突!
四.算法對比
第一種算法只要解決自增id問題就可以避免沖突,自增id可以采用數(shù)據(jù)庫自增主鍵,每次生成短碼只需一次數(shù)據(jù)庫操作(insert操作,獲取主鍵id,然后算出短碼即可)
第二種和第三種算法其實都差不多,都是依賴于程序隨機(jī),容易出現(xiàn)沖突,這就需要每次在插入數(shù)據(jù)庫的時候判重,效率低一些!
5.安全
短鏈接雖然方便了傳輸和記憶,但是由于鏈接組成的字符個數(shù)少,更容易被爆破、猜測攻擊,攻擊者可以輕松遍歷所有字符組成的鏈接!
所以不建議使用短鏈接發(fā)送具有私密性的網(wǎng)址,比如說重置密碼鏈接,對一些權(quán)限、敏感信息的鏈接要做好二次鑒權(quán)!
以上是PHP實現(xiàn)短網(wǎng)址的方法的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注創(chuàng)新互聯(lián)成都網(wǎng)站設(shè)計公司行業(yè)資訊頻道!
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。