用java實現(xiàn)一個p2p種子搜索功能的方法-創(chuàng)新互聯(lián)

這篇文章給大家分享的是有關用java實現(xiàn)一個p2p種子搜索功能的方法的內容。小編覺得挺實用的，因此分享給大家做個參考。一起跟隨小編過來看看吧。

成都做網站、網站建設介紹好的網站是理念、設計和技術的結合。創(chuàng)新互聯(lián)擁有的網站設計理念、多方位的設計風格、經驗豐富的設計團隊。提供PC端+手機端網站建設，用營銷思維進行網站設計、采用先進技術開源代碼、注重用戶體驗與SEO基礎，將技術與創(chuàng)意整合到網站之中，以契合客戶的方式做到創(chuàng)意性的視覺化效果。

很多年前對p2p就有很大的興趣，不過都是停留在理論上，一直沒有機會去真正的實踐。最近把這個東西實現(xiàn)了一下，從剛開始入手到現(xiàn)在，我覺得有些東西可以分享一下。進入正題吧那就

基本概念

再講p2p之前，我想先講一下我們是如何進行下載文件的。我列舉一下幾種文件下載的方式

1.使用http協(xié)議下載，使用的最多的可能就是通過瀏覽器進行文件的下載。

2.使用ftp下載，ftp有兩種模式，一種是port(主動)模式，這種模式客戶端會在本地開啟一個端口N(>1023)建立ftp連接，然后發(fā)送給ftp服務器N+1監(jiān)聽端口用來數(shù)據(jù)傳輸，當有防火墻或者客戶端被nat的情況下就無法下載。另外一種方式是被動模式(passive)，這種模式ftp服務端除了21端口以外會開啟一個另外大于1023的端口，也就是說客戶端會主動發(fā)起ftp連接和數(shù)據(jù)傳輸連接，只要ftp服務器開放了這個端口那就不會有問題。

上面兩種方式可以統(tǒng)稱為cs架構，這種架構下面，資源都集中在服務端，當數(shù)據(jù)量大到一定程度的時候就會出現(xiàn)問題。為了解決這個問題，我們可能會想到分布式去中心化，于是p2p應運而生，p2p即 peer to peer，這是一種對等架構，每個節(jié)點既是客服端又是服務端。

p2p架構

當把資源都存儲在每個節(jié)點上面的時候，我們可能會想，當我下載一個資源的時候，那我怎么知道這個文件在那些機器上面能下載呢？

早期的p2p架構中存在一個tracker的角色，這個tracker負責存儲文件的元數(shù)據(jù)信息。那么現(xiàn)在文件會保存在每個peer上面，然后通過tracker獲取文件信息。

用java實現(xiàn)一個p2p種子搜索功能的方法

這種架構下面我們所有的文件都分布式了，只是tracker會負責存儲所有文件的元數(shù)據(jù)信息，所以tracker只需要存儲少量數(shù)據(jù)，相對于存在文件會相對輕松很多了。

但是一旦出現(xiàn)tracker服務器掛了或者服務不可用那么就會導致所有的文件都無法下載，因為它還沒有完全的分布式，為了完全的去中心化，后面出來一種trackerless架構，

這個時候不在存在tracker這個東西，所有的文件包括文件的元數(shù)據(jù)信息都分布式存儲。

DHT

DHT(Distributed Hash Table)分布式哈希表，它是用來代替tracker。實現(xiàn)dht的算法有很多，比如Kademlia算法等等。
幾個概念：

1.nodeid 在dht網絡中每個nodeid都是160bit

2.XOR 兩個節(jié)點之間的距離使用異或來計算

3.routting table路由表

這里的話還是主要講實現(xiàn)所以原理這部分的話網上也有很多資料大家可以參考看看

如何實現(xiàn)

實現(xiàn)種子搜索分為兩步，第一步是爬蟲，用來爬取網上的種子信息，第二步是加入搜索。

需要具備以下知識：種子,bittorrent dht 協(xié)議,bencoded

提到p2p不得不提種子，就是那種.torrent結果的那種文件，大家可能都是用過bt種子下載過文件，下載文件使用的是bittorrent協(xié)議。那么如何收集網絡上面的種子呢？

bt種子包含的主要字段：戳：https://segmentfault.com/a/1190000000681331

在dht中獲取的種子叫trackerless torrent，沒有announce這個屬性，但是會有nodes屬性來代替。官方建議不要router.bittorrent.com把這個添加到種子里面，也不要添加到路由表。

1.如何從dht中獲取種子

如果想要得到種子信息，那么必須要對DHT Protocol深入了解，bep_0005描述了DHT Protocol

具體可以戳這里 http://www.bittorrent.org/beps/bep_0005.html

如何實現(xiàn)一個路由表：

路由表覆蓋了所有Node的id，從0到2的160次方。路由表可以由bucket組成，每個bucket覆蓋了所有node的一部分。

剛開始一個路由表只有一個bucket，覆蓋了所有的nodeid。每個bucket，只能hold最多K個nodes，當前這個K值是8。如果bucket已經滿了，并且里面的node都是好的，而且自身的nodeid不在這個bucket里面，那么就講原來的bucket分成兩個新的bucket，分別覆蓋0..2¹⁵⁹和2¹⁵⁹..2¹⁶⁰。

當一個bucket已經滿了的時候，新node很容易被丟棄，如果這里面的node掉線了，那么就會被replace。如果一個節(jié)點最近15分鐘都沒有ping過，那么就對這個節(jié)點發(fā)起ping，如果沒有返回response，那么這個節(jié)點也會被replace。

每一個bucket應該有一個last changed屬性，用來表明這個bucket的活躍度。這幾種情況會更新這個字段：

1.bucket里面的node被ping了并且有response

2.一個node添加到了這個bucket里面

3.bucket里面的node被replace了

bucket在15分鐘之內沒有更新這個字段的話，那么就會隨機選取一個在該bucket范圍內的id，做find_node操作。

KRPC Protocol

dht網絡中通過KRPC Protocol來傳遞消息。

1.ping

ping查詢主要用來心跳檢查

2.find_node

查找一個節(jié)點，對方會從自己的路由表中查詢最近的N個節(jié)點返回，一般是8個

3.get_peers

根據(jù)infohash查找擁有該infohash的peer，如果查到到返回peers，沒有查找到返回nodes

4.announce_peer

告訴其他的peers，自己也擁有infohash。

注意以上四個都會刷新路由表

一開始路由表里面沒有任何節(jié)點，所以需要從超級節(jié)點(例如dht.transmissionbt.com等等)通過find_node請求來查找并添加節(jié)點，返回的節(jié)點在進行find_node。

我自己實現(xiàn)的路由表稍微和上面描述的不太一樣。

dht網絡中采用udp進行數(shù)據(jù)傳輸，所以我只用開啟一個upd端口不斷的發(fā)送find_node請求建立路由表，然后通過get_peers和announce_peer來獲取種子的infohash。

當我們加入dht網絡后，通過上面介紹的四個方法只能得到種子文件的infohash，所以我們還需要通過infohash來下載種子，具體可以參照bep_009http://www.bittorrent.org/beps/bep_0009.html

我們主要通過bep_009來獲取種子的名字字段，獲取了文件名字段就可以根據(jù)名字和infohash來建立索引提供搜索。（這里主要構建磁力鏈接，有了磁力鏈接就可以去迅雷，百度網盤等去下載資源啦）

大部分磁力鏈接格式：magnet:?xt=urn:btih:infohash

感謝各位的閱讀！關于用java實現(xiàn)一個p2p種子搜索功能的方法就分享到這里了，希望以上內容可以對大家有一定的幫助，讓大家可以學到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到吧！

網站欄目：用java實現(xiàn)一個p2p種子搜索功能的方法-創(chuàng)新互聯(lián)
URL鏈接：http://weahome.cn/article/gcdop.html

真实的国产乱ⅩXXX66竹夫人,五月香六月婷婷激情综合,亚洲日本VA一区二区三区,亚洲精品一区二区三区麻豆

用java實現(xiàn)一個p2p種子搜索功能的方法-創(chuàng)新互聯(lián)

其他資訊

網站制作

企業(yè)服務

網站建設

服務器托管