事務處理是數(shù)據(jù)庫的能力、隊列可以使用nosql實現(xiàn)、比如redis、mongodb、或者用數(shù)據(jù)庫也可以模擬實現(xiàn)。兩個人做同一件事可以使用隊列,先依照兩個人做事的先后順序放到隊列,在通過后臺程序順序讀取隊列操作邏輯
創(chuàng)新互聯(lián)長期為超過千家客戶提供的網(wǎng)站建設服務,團隊從業(yè)經(jīng)驗10年,關注不同地域、不同群體,并針對不同對象提供差異化的產(chǎn)品和服務;打造開放共贏平臺,與合作伙伴共同營造健康的互聯(lián)網(wǎng)生態(tài)環(huán)境。為金門企業(yè)提供專業(yè)的網(wǎng)站設計、成都做網(wǎng)站,金門網(wǎng)站改版等技術服務。擁有十多年豐富建站經(jīng)驗和眾多成功案例,為您定制開發(fā)。
Reids是一個比較高級的開源key-value存儲系統(tǒng),采用ANSI C實現(xiàn)。其與memcached類似,但是支持持久化數(shù)據(jù)存儲入隊操作
復制代碼 代碼如下:
?php
$redis = new Redis();
$redis-connect('127.0.0.1',6379);
while(True){
try{
$value = 'value_'.date('Y-m-d H:i:s');
$redis-LPUSH('key1',$value);
sleep(rand()%3);
echo $value."\n";
}catch(Exception $e){
echo $e-getMessage()."\n";
}
}
?
出隊操作
復制代碼 代碼如下:
?php
$redis = new Redis();
$redis-pconnect('127.0.0.1',6379);
while(True){
try{
echo $redis-LPOP('key1')."\n";
}catch(Exception $e){
echo $e-getMessage()."\n";
}
sleep(rand()%3);
}?
如何使用Redis 做隊列操作
Reids是一個比較高級的開源key-value存儲系統(tǒng),采用ANSI C實現(xiàn)。其與memcached類似,但是支持持久化數(shù)據(jù)存儲,同時value支持多種類型:字符串 (同memcached中的value),列表 ,集合 (Set),有序集合 (OrderSet)和Hash 。所有的值類型均支持原子操作,如列表中追加彈出元素,集合中插入移除元素等。Rdids的數(shù)據(jù)大部分位于內(nèi)存中,其讀寫效率非常高,其提供AOF(追加 式操作記錄文件)和DUMP(定期數(shù)據(jù)備份)兩種持久化方式。Redis支持自定義的VM(虛擬內(nèi)存)機制,當數(shù)據(jù)容量超過內(nèi)存時,可以將部分Value 存儲到文件中。同時Redis支持Master-Slave機制,可以進行數(shù)據(jù)復制。
可以把Redis的list結構當隊列來用.
從上面Redis的場景和作用來說,對于我們現(xiàn)在的開發(fā)活動,究竟能把Redis引入在那些場景,而不是把這么好的東東演變成“為了使用Redis,而Redis”的慘烈局面呢?當然,具體問題具體分析,這個真的很重要哈。
緩存?分布式緩存?
隊列?分布式隊列?
某些系統(tǒng)應用(例如,電信、銀行和大型互聯(lián)網(wǎng)應用等)都會使用到,當然,現(xiàn)在大行其道的memcache就是很好的證明;但從某一方面來說,memcache是否能把兩張囊括其中,而且能做到更好(沒有實際的應用過,所以只是拋出)。但從Redis身上,我就能感覺到,Redis,就能把隊列和緩存兩張都囊括其中,而且都不會產(chǎn)生并發(fā)環(huán)境下的困擾,因為Redis中的操作都是原子操作來著。
至于評論兩者的孰好孰壞就免了,存在就是理由,選擇適合的就是最好的。
下面開始玩玩Redis中的隊列(分布式)設計YY吧,請大蝦們多多指點。
狀況場景:
現(xiàn)在的項目,都是部署在多個服務器,或者多個IP上,而且前臺經(jīng)由F5分發(fā),所以用戶的請求究竟落在那一臺的服務器上,是無法確定的。對于項目中,有一秒殺設計,剛開始沒有考慮到這種部署,同時也是使用最容易處理的方式,直接給數(shù)據(jù)庫表鎖行記錄(Oracle上的)??梢哉f,對于不同的應用部署,而只有一臺數(shù)據(jù)庫服務器來說,很“輕松”的就解決了這個并發(fā)的問題。所以現(xiàn)在考慮一下,是不是挪到應用上,避免數(shù)據(jù)庫服務器也摻雜到業(yè)務上。
比如,現(xiàn)在有2臺應用服務器,1臺數(shù)據(jù)庫服務器。想法是,把Redis部署在數(shù)據(jù)庫服務器上,兩臺服務器在操作并發(fā)緩存或者隊列時,先從Redis服務器上,取得在兩臺應用服務器的代理對象,再做入列出列的操作。
看代碼實現(xiàn)(PHP)
入隊列操作文件 list_push.php
復制代碼 代碼如下:
?php
$redis = getRedisInstance();//從Redis服務器拿到redis實例$redis-connect('Redis服務器IP', 6379);
while (true) {
$redis-lPush('list1', 'A_'.date('Y-m-d H:i:s'));sleep(rand()%3);
}
?
執(zhí)行# php list_push.php
出隊列操作 list_pop.php文件
復制代碼 代碼如下:
?php
$redis = getRedisInstance();//從Redis服務器拿到redis實例$redis-pconnect('Redis服務器IP', 6379);
while(true) {
try {
var_export( $redis-blPop('list1', 10) );} catch(Exception $e) {
//echo $e;
}
}
實現(xiàn)方法(Python)
1.入隊列(write.py)
復制代碼 代碼如下:
#!/usr/bin/env python
import time
from redis import Redis
redis = Redis(host='127.0.0.1', port=6379)while True:
now = time.strftime("%Y/%m/%d %H:%M:%S")
redis.lpush('test_queue', now)
time.sleep(1)
2.出隊列(read.py)
復制代碼 代碼如下:
#!/usr/bin/env python
import sys
from redis import Redis
redis = Redis(host='127.0.0.1', port=6379)while True:
res = redis.rpop('test_queue')
if res == None:
pass
else:
print str(res)
一、消息隊列概述\x0d\x0a消息隊列中間件是分布式系統(tǒng)中重要的組件,主要解決應用耦合,異步消息,流量削鋒等問題。實現(xiàn)高性能,高可用,可伸縮和最終一致性架構。是大型分布式系統(tǒng)不可缺少的中間件。\x0d\x0a目前在生產(chǎn)環(huán)境,使用較多的消息隊列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。\x0d\x0a二、消息隊列應用場景\x0d\x0a以下介紹消息隊列在實際應用中常用的使用場景。異步處理,應用解耦,流量削鋒和消息通訊四個場景。\x0d\x0a2.1異步處理\x0d\x0a場景說明:用戶注冊后,需要發(fā)注冊郵件和注冊短信。傳統(tǒng)的做法有兩種1.串行的方式;2.并行方式。\x0d\x0a(1)串行方式:將注冊信息寫入數(shù)據(jù)庫成功后,發(fā)送注冊郵件,再發(fā)送注冊短信。以上三個任務全部完成后,返回給客戶端。(架構KKQ:466097527,歡迎加入)\x0d\x0a(2)并行方式:將注冊信息寫入數(shù)據(jù)庫成功后,發(fā)送注冊郵件的同時,發(fā)送注冊短信。以上三個任務完成后,返回給客戶端。與串行的差別是,并行的方式可以提高處理的時間。\x0d\x0a假設三個業(yè)務節(jié)點每個使用50毫秒鐘,不考慮網(wǎng)絡等其他開銷,則串行方式的時間是150毫秒,并行的時間可能是100毫秒。\x0d\x0a因為CPU在單位時間內(nèi)處理的請求數(shù)是一定的,假設CPU1秒內(nèi)吞吐量是100次。則串行方式1秒內(nèi)CPU可處理的請求量是7次(1000/150)。并行方式處理的請求量是10次(1000/100)。\x0d\x0a小結:如以上案例描述,傳統(tǒng)的方式系統(tǒng)的性能(并發(fā)量,吞吐量,響應時間)會有瓶頸。如何解決這個問題呢?\x0d\x0a引入消息隊列,將不是必須的業(yè)務邏輯,異步處理。改造后的架構如下:\x0d\x0a按照以上約定,用戶的響應時間相當于是注冊信息寫入數(shù)據(jù)庫的時間,也就是50毫秒。注冊郵件,發(fā)送短信寫入消息隊列后,直接返回,因此寫入消息隊列的速度很快,基本可以忽略,因此用戶的響應時間可能是50毫秒。因此架構改變后,系統(tǒng)的吞吐量提高到每秒20 QPS。比串行提高了3倍,比并行提高了兩倍。\x0d\x0a2.2應用解耦\x0d\x0a場景說明:用戶下單后,訂單系統(tǒng)需要通知庫存系統(tǒng)。傳統(tǒng)的做法是,訂單系統(tǒng)調(diào)用庫存系統(tǒng)的接口。如下圖:\x0d\x0a傳統(tǒng)模式的缺點:\x0d\x0a1) 假如庫存系統(tǒng)無法訪問,則訂單減庫存將失敗,從而導致訂單失敗;\x0d\x0a2) 訂單系統(tǒng)與庫存系統(tǒng)耦合;\x0d\x0a如何解決以上問題呢?引入應用消息隊列后的方案,如下圖:\x0d\x0a訂單系統(tǒng):用戶下單后,訂單系統(tǒng)完成持久化處理,將消息寫入消息隊列,返回用戶訂單下單成功。\x0d\x0a庫存系統(tǒng):訂閱下單的消息,采用拉/推的方式,獲取下單信息,庫存系統(tǒng)根據(jù)下單信息,進行庫存操作。\x0d\x0a假如:在下單時庫存系統(tǒng)不能正常使用。也不影響正常下單,因為下單后,訂單系統(tǒng)寫入消息隊列就不再關心其他的后續(xù)操作了。實現(xiàn)訂單系統(tǒng)與庫存系統(tǒng)的應用解耦。\x0d\x0a2.3流量削鋒\x0d\x0a流量削鋒也是消息隊列中的常用場景,一般在秒殺或團搶活動中使用廣泛。\x0d\x0a應用場景:秒殺活動,一般會因為流量過大,導致流量暴增,應用掛掉。為解決這個問題,一般需要在應用前端加入消息隊列。\x0d\x0a可以控制活動的人數(shù);\x0d\x0a可以緩解短時間內(nèi)高流量壓垮應用;\x0d\x0a用戶的請求,服務器接收后,首先寫入消息隊列。假如消息隊列長度超過最大數(shù)量,則直接拋棄用戶請求或跳轉到錯誤頁面;\x0d\x0a秒殺業(yè)務根據(jù)消息隊列中的請求信息,再做后續(xù)處理。\x0d\x0a2.4日志處理\x0d\x0a日志處理是指將消息隊列用在日志處理中,比如Kafka的應用,解決大量日志傳輸?shù)膯栴}。架構簡化如下:\x0d\x0a日志采集客戶端,負責日志數(shù)據(jù)采集,定時寫受寫入Kafka隊列;\x0d\x0aKafka消息隊列,負責日志數(shù)據(jù)的接收,存儲和轉發(fā);\x0d\x0a日志處理應用:訂閱并消費kafka隊列中的日志數(shù)據(jù);\x0d\x0a以下是新浪kafka日志處理應用案例:\x0d\x0a(1)Kafka:接收用戶日志的消息隊列。\x0d\x0a(2)Logstash:做日志解析,統(tǒng)一成JSON輸出給Elasticsearch。\x0d\x0a(3)Elasticsearch:實時日志分析服務的核心技術,一個schemaless,實時的數(shù)據(jù)存儲服務,通過index組織數(shù)據(jù),兼具強大的搜索和統(tǒng)計功能。\x0d\x0a(4)Kibana:基于Elasticsearch的數(shù)據(jù)可視化組件,超強的數(shù)據(jù)可視化能力是眾多公司選擇ELK stack的重要原因。\x0d\x0a2.5消息通訊\x0d\x0a消息通訊是指,消息隊列一般都內(nèi)置了高效的通信機制,因此也可以用在純的消息通訊。比如實現(xiàn)點對點消息隊列,或者聊天室等。\x0d\x0a點對點通訊:\x0d\x0a客戶端A和客戶端B使用同一隊列,進行消息通訊。\x0d\x0a聊天室通訊:\x0d\x0a客戶端A,客戶端B,客戶端N訂閱同一主題,進行消息發(fā)布和接收。實現(xiàn)類似聊天室效果。\x0d\x0a以上實際是消息隊列的兩種消息模式,點對點或發(fā)布訂閱模式。模型為示意圖,供參考。\x0d\x0a三、消息中間件示例\x0d\x0a3.1電商系統(tǒng)\x0d\x0a消息隊列采用高可用,可持久化的消息中間件。比如Active MQ,Rabbit MQ,Rocket Mq。(1)應用將主干邏輯處理完成后,寫入消息隊列。消息發(fā)送是否成功可以開啟消息的確認模式。(消息隊列返回消息接收成功狀態(tài)后,應用再返回,這樣保障消息的完整性)\x0d\x0a(2)擴展流程(發(fā)短信,配送處理)訂閱隊列消息。采用推或拉的方式獲取消息并處理。\x0d\x0a(3)消息將應用解耦的同時,帶來了數(shù)據(jù)一致性問題,可以采用最終一致性方式解決。比如主數(shù)據(jù)寫入數(shù)據(jù)庫,擴展應用根據(jù)消息隊列,并結合數(shù)據(jù)庫方式實現(xiàn)基于消息隊列的后續(xù)處理。\x0d\x0a3.2日志收集系統(tǒng)\x0d\x0a分為Zookeeper注冊中心,日志收集客戶端,Kafka集群和Storm集群(OtherApp)四部分組成。\x0d\x0aZookeeper注冊中心,提出負載均衡和地址查找服務;\x0d\x0a日志收集客戶端,用于采集應用系統(tǒng)的日志,并將數(shù)據(jù)推送到kafka隊列;\x0d\x0a四、JMS消息服務\x0d\x0a講消息隊列就不得不提JMS 。JMS(Java Message Service,Java消息服務)API是一個消息服務的標準/規(guī)范,允許應用程序組件基于JavaEE平臺創(chuàng)建、發(fā)送、接收和讀取消息。它使分布式通信耦合度更低,消息服務更加可靠以及異步性。\x0d\x0a在EJB架構中,有消息bean可以無縫的與JM消息服務集成。在J2EE架構模式中,有消息服務者模式,用于實現(xiàn)消息與應用直接的解耦。\x0d\x0a4.1消息模型\x0d\x0a在JMS標準中,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。\x0d\x0a4.1.1 P2P模式\x0d\x0aP2P模式包含三個角色:消息隊列(Queue),發(fā)送者(Sender),接收者(Receiver)。每個消息都被發(fā)送到一個特定的隊列,接收者從隊列中獲取消息。隊列保留著消息,直到他們被消費或超時。\x0d\x0aP2P的特點\x0d\x0a每個消息只有一個消費者(Consumer)(即一旦被消費,消息就不再在消息隊列中)\x0d\x0a發(fā)送者和接收者之間在時間上沒有依賴性,也就是說當發(fā)送者發(fā)送了消息之后,不管接收者有沒有正在運行,它不會影響到消息被發(fā)送到隊列\(zhòng)x0d\x0a接收者在成功接收消息之后需向隊列應答成功\x0d\x0a如果希望發(fā)送的每個消息都會被成功處理的話,那么需要P2P模式。(架構KKQ:466097527,歡迎加入)\x0d\x0a4.1.2 Pub/sub模式\x0d\x0a包含三個角色主題(Topic),發(fā)布者(Publisher),訂閱者(Subscriber) 。多個發(fā)布者將消息發(fā)送到Topic,系統(tǒng)將這些消息傳遞給多個訂閱者。\x0d\x0aPub/Sub的特點\x0d\x0a每個消息可以有多個消費者\x0d\x0a發(fā)布者和訂閱者之間有時間上的依賴性。針對某個主題(Topic)的訂閱者,它必須創(chuàng)建一個訂閱者之后,才能消費發(fā)布者的消息。\x0d\x0a為了消費消息,訂閱者必須保持運行的狀態(tài)。\x0d\x0a為了緩和這樣嚴格的時間相關性,JMS允許訂閱者創(chuàng)建一個可持久化的訂閱。這樣,即使訂閱者沒有被激活(運行),它也能接收到發(fā)布者的消息。\x0d\x0a如果希望發(fā)送的消息可以不被做任何處理、或者只被一個消息者處理、或者可以被多個消費者處理的話,那么可以采用Pub/Sub模型。\x0d\x0a4.2消息消費\x0d\x0a在JMS中,消息的產(chǎn)生和消費都是異步的。對于消費來說,JMS的消息者可以通過兩種方式來消費消息。\x0d\x0a(1)同步\x0d\x0a訂閱者或接收者通過receive方法來接收消息,receive方法在接收到消息之前(或超時之前)將一直阻塞;\x0d\x0a(2)異步\x0d\x0a訂閱者或接收者可以注冊為一個消息監(jiān)聽器。當消息到達之后,系統(tǒng)自動調(diào)用監(jiān)聽器的onMessage方法。\x0d\x0aJNDI:Java命名和目錄接口,是一種標準的Java命名系統(tǒng)接口??梢栽诰W(wǎng)絡上查找和訪問服務。通過指定一個資源名稱,該名稱對應于數(shù)據(jù)庫或命名服務中的一個記錄,同時返回資源連接建立所必須的信息。\x0d\x0aJNDI在JMS中起到查找和訪問發(fā)送目標或消息來源的作用。(架構KKQ:466097527,歡迎加入)\x0d\x0a4.3JMS編程模型\x0d\x0a(1) ConnectionFactory\x0d\x0a創(chuàng)建Connection對象的工廠,針對兩種不同的jms消息模型,分別有QueueConnectionFactory和TopicConnectionFactory兩種??梢酝ㄟ^JNDI來查找ConnectionFactory對象。\x0d\x0a(2) Destination\x0d\x0aDestination的意思是消息生產(chǎn)者的消息發(fā)送目標或者說消息消費者的消息來源。對于消息生產(chǎn)者來說,它的Destination是某個隊列(Queue)或某個主題(Topic);對于消息消費者來說,它的Destination也是某個隊列或主題(即消息來源)。\x0d\x0a所以,Destination實際上就是兩種類型的對象:Queue、Topic可以通過JNDI來查找Destination。\x0d\x0a(3) Connection\x0d\x0aConnection表示在客戶端和JMS系統(tǒng)之間建立的鏈接(對TCP/IP socket的包裝)。Connection可以產(chǎn)生一個或多個Session。跟ConnectionFactory一樣,Connection也有兩種類型:QueueConnection和TopicConnection。\x0d\x0a(4) Session\x0d\x0aSession是操作消息的接口。可以通過session創(chuàng)建生產(chǎn)者、消費者、消息等。Session提供了事務的功能。當需要使用session發(fā)送/接收多個消息時,可以將這些發(fā)送/接收動作放到一個事務中。同樣,也分QueueSession和TopicSession。\x0d\x0a(5) 消息的生產(chǎn)者\x0d\x0a消息生產(chǎn)者由Session創(chuàng)建,并用于將消息發(fā)送到Destination。同樣,消息生產(chǎn)者分兩種類型:QueueSender和TopicPublisher??梢哉{(diào)用消息生產(chǎn)者的方法(send或publish方法)發(fā)送消息。\x0d\x0a(6) 消息消費者\x0d\x0a消息消費者由Session創(chuàng)建,用于接收被發(fā)送到Destination的消息。兩種類型:QueueReceiver和TopicSubscriber??煞謩e通過session的createReceiver(Queue)或createSubscriber(Topic)來創(chuàng)建。當然,也可以session的creatDurableSubscriber方法來創(chuàng)建持久化的訂閱者。\x0d\x0a(7) MessageListener\x0d\x0a消息監(jiān)聽器。如果注冊了消息監(jiān)聽器,一旦消息到達,將自動調(diào)用監(jiān)聽器的onMessage方法。EJB中的MDB(Message-Driven Bean)就是一種MessageListener。\x0d\x0a深入學習JMS對掌握JAVA架構,EJB架構有很好的幫助,消息中間件也是大型分布式系統(tǒng)必須的組件。本次分享主要做全局性介紹,具體的深入需要大家學習,實踐,總結,領會。\x0d\x0a五、常用消息隊列\(zhòng)x0d\x0a一般商用的容器,比如WebLogic,JBoss,都支持JMS標準,開發(fā)上很方便。但免費的比如Tomcat,Jetty等則需要使用第三方的消息中間件。本部分內(nèi)容介紹常用的消息中間件(Active MQ,Rabbit MQ,Zero MQ,Kafka)以及他們的特點。\x0d\x0a5.1 ActiveMQ\x0d\x0aActiveMQ 是Apache出品,最流行的,能力強勁的開源消息總線。ActiveMQ 是一個完全支持JMS1.1和J2EE 1.4規(guī)范的 JMS Provider實現(xiàn),盡管JMS規(guī)范出臺已經(jīng)是很久的事情了,但是JMS在當今的J2EE應用中間仍然扮演著特殊的地位。\x0d\x0aActiveMQ特性如下:\x0d\x0a⒈ 多種語言和協(xié)議編寫客戶端。語言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協(xié)議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP\x0d\x0a⒉ 完全支持JMS1.1和J2EE 1.4規(guī)范 (持久化,XA消息,事務)\x0d\x0a⒊ 對spring的支持,ActiveMQ可以很容易內(nèi)嵌到使用Spring的系統(tǒng)里面去,而且也支持Spring2.0的特性\x0d\x0a⒋ 通過了常見J2EE服務器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試,其中通過JCA 1.5 resource adaptors的配置,可以讓ActiveMQ可以自動的部署到任何兼容J2EE 1.4 商業(yè)服務器上\x0d\x0a⒌ 支持多種傳送協(xié)議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA\x0d\x0a⒍ 支持通過JDBC和journal提供高速的消息持久化\x0d\x0a⒎ 從設計上保證了高性能的集群,客戶端-服務器,點對點\x0d\x0a⒏ 支持Ajax\x0d\x0a⒐ 支持與Axis的整合\x0d\x0a⒑ 可以很容易得調(diào)用內(nèi)嵌JMS provider,進行測試\x0d\x0a5.2 RabbitMQ\x0d\x0aRabbitMQ是流行的開源消息隊列系統(tǒng),用erlang語言開發(fā)。RabbitMQ是AMQP(高級消息隊列協(xié)議)的標準實現(xiàn)。支持多種客戶端,如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持AJAX,持久化。用于在分布式系統(tǒng)中存儲轉發(fā)消息,在易用性、擴展性、高可用性等方面表現(xiàn)不俗。\x0d\x0a幾個重要概念:\x0d\x0aBroker:簡單來說就是消息隊列服務器實體。\x0d\x0aExchange:消息交換機,它指定消息按什么規(guī)則,路由到哪個隊列。\x0d\x0aQueue:消息隊列載體,每個消息都會被投入到一個或多個隊列。\x0d\x0aBinding:綁定,它的作用就是把exchange和queue按照路由規(guī)則綁定起來。\x0d\x0aRouting Key:路由關鍵字,exchange根據(jù)這個關鍵字進行消息投遞。\x0d\x0avhost:虛擬主機,一個broker里可以開設多個vhost,用作不同用戶的權限分離。\x0d\x0aproducer:消息生產(chǎn)者,就是投遞消息的程序。\x0d\x0aconsumer:消息消費者,就是接受消息的程序。\x0d\x0achannel:消息通道,在客戶端的每個連接里,可建立多個channel,每個channel代表一個會話任務。\x0d\x0a消息隊列的使用過程,如下:\x0d\x0a(1)客戶端連接到消息隊列服務器,打開一個channel。\x0d\x0a(2)客戶端聲明一個exchange,并設置相關屬性。\x0d\x0a(3)客戶端聲明一個queue,并設置相關屬性。\x0d\x0a(4)客戶端使用routing key,在exchange和queue之間建立好綁定關系。\x0d\x0a(5)客戶端投遞消息到exchange。\x0d\x0aexchange接收到消息后,就根據(jù)消息的key和已經(jīng)設置的binding,進行消息路由,將消息投遞到一個或多個隊列里。\x0d\x0a5.3 ZeroMQ\x0d\x0a號稱史上最快的消息隊列,它實際類似于Socket的一系列接口,他跟Socket的區(qū)別是:普通的socket是端到端的(1:1的關系),而ZMQ卻是可以N:M 的關系,人們對BSD套接字的了解較多的是點對點的連接,點對點連接需要顯式地建立連接、銷毀連接、選擇協(xié)議(TCP/UDP)和處理錯誤等,而ZMQ屏蔽了這些細節(jié),讓你的網(wǎng)絡編程更為簡單。ZMQ用于node與node間的通信,node可以是主機或者是進程。\x0d\x0a引用官方的說法: “ZMQ(以下ZeroMQ簡稱ZMQ)是一個簡單好用的傳輸層,像框架一樣的一個socket library,他使得Socket編程更加簡單、簡潔和性能更高。是一個消息處理隊列庫,可在多個線程、內(nèi)核和主機盒之間彈性伸縮。ZMQ的明確目標是“成為標準網(wǎng)絡協(xié)議棧的一部分,之后進入Linux內(nèi)核”。現(xiàn)在還未看到它們的成功。但是,它無疑是極具前景的、并且是人們更加需要的“傳統(tǒng)”BSD套接字之上的一 層封裝。ZMQ讓編寫高性能網(wǎng)絡應用程序極為簡單和有趣?!盶x0d\x0a特點是:\x0d\x0a高性能,非持久化;\x0d\x0a跨平臺:支持Linux、Windows、OS X等。\x0d\x0a多語言支持; C、C++、Java、.NET、Python等30多種開發(fā)語言。\x0d\x0a可單獨部署或集成到應用中使用;\x0d\x0a可作為Socket通信庫使用。\x0d\x0a與RabbitMQ相比,ZMQ并不像是一個傳統(tǒng)意義上的消息隊列服務器,事實上,它也根本不是一個服務器,更像一個底層的網(wǎng)絡通訊庫,在Socket API之上做了一層封裝,將網(wǎng)絡通訊、進程通訊和線程通訊抽象為統(tǒng)一的API接口。支持“Request-Reply “,”Publisher-Subscriber“,”Parallel Pipeline”三種基本模型和擴展模型。\x0d\x0aZeroMQ高性能設計要點:\x0d\x0a1、無鎖的隊列模型\x0d\x0a對于跨線程間的交互(用戶端和session)之間的數(shù)據(jù)交換通道pipe,采用無鎖的隊列算法CAS;在pipe兩端注冊有異步事件,在讀或者寫消息到pipe的時,會自動觸發(fā)讀寫事件。\x0d\x0a2、批量處理的算法\x0d\x0a對于傳統(tǒng)的消息處理,每個消息在發(fā)送和接收的時候,都需要系統(tǒng)的調(diào)用,這樣對于大量的消息,系統(tǒng)的開銷比較大,zeroMQ對于批量的消息,進行了適應性的優(yōu)化,可以批量的接收和發(fā)送消息。\x0d\x0a3、多核下的線程綁定,無須CPU切換\x0d\x0a區(qū)別于傳統(tǒng)的多線程并發(fā)模式,信號量或者臨界區(qū), zeroMQ充分利用多核的優(yōu)勢,每個核綁定運行一個工作者線程,避免多線程之間的CPU切換開銷。\x0d\x0a5.4 Kafka\x0d\x0aKafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),它可以處理消費者規(guī)模的網(wǎng)站中的所有動作流數(shù)據(jù)。 這種動作(網(wǎng)頁瀏覽,搜索和其他用戶的行動)是在現(xiàn)代網(wǎng)絡上的許多社會功能的一個關鍵因素。 這些數(shù)據(jù)通常是由于吞吐量的要求而通過處理日志和日志聚合來解決。 對于像Hadoop的一樣的日志數(shù)據(jù)和離線分析系統(tǒng),但又要求實時處理的限制,這是一個可行的解決方案。Kafka的目的是通過Hadoop的并行加載機制來統(tǒng)一線上和離線的消息處理,也是為了通過集群機來提供實時的消費。\x0d\x0aKafka是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng),有如下特性:\x0d\x0a通過O(1)的磁盤數(shù)據(jù)結構提供消息的持久化,這種結構對于即使數(shù)以TB的消息存儲也能夠保持長時間的穩(wěn)定性能。(文件追加的方式寫入數(shù)據(jù),過期的數(shù)據(jù)定期刪除)\x0d\x0a高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數(shù)百萬的消息。\x0d\x0a支持通過Kafka服務器和消費機集群來分區(qū)消息。\x0d\x0a支持Hadoop并行數(shù)據(jù)加載。\x0d\x0aKafka相關概念\x0d\x0aBroker\x0d\x0aKafka集群包含一個或多個服務器,這種服務器被稱為broker[5]\x0d\x0aTopic\x0d\x0a每條發(fā)布到Kafka集群的消息都有一個類別,這個類別被稱為Topic。(物理上不同Topic的消息分開存儲,邏輯上一個Topic的消息雖然保存于一個或多個broker上但用戶只需指定消息的Topic即可生產(chǎn)或消費數(shù)據(jù)而不必關心數(shù)據(jù)存于何處)\x0d\x0aPartition\x0d\x0aParition是物理上的概念,每個Topic包含一個或多個Partition.\x0d\x0aProducer\x0d\x0a負責發(fā)布消息到Kafka broker\x0d\x0aConsumer\x0d\x0a消息消費者,向Kafka broker讀取消息的客戶端。\x0d\x0aConsumer Group\x0d\x0a每個Consumer屬于一個特定的Consumer Group(可為每個Consumer指定group name,若不指定group name則屬于默認的group)。\x0d\x0a一般應用在大數(shù)據(jù)日志處理或?qū)崟r性(少量延遲),可靠性(少量丟數(shù)據(jù))要求稍低的場景使用。
實際上有一個非常簡單的辦法,你可以利用數(shù)據(jù)庫操作的原子性來實現(xiàn),不需要那么復雜的鎖機制,甚至隊列。就按你的方法來,假設任務數(shù)據(jù)表 task 里有兩個字段 id, status,我們定義status三個狀態(tài)
0: 待處理1: 正在處理2: 處理完成
假設你有一堆 PHP 進程都用如下 SQL 語句去取出數(shù)據(jù)庫里的待處理任務
SELECT * FROM task WHERE status = 0
取出來以后,我們?yōu)榱朔乐蛊渌脩舨辉僦貜腿〕鲆阉臓顟B(tài)標記為 1
UPDATE task SET status = 1 WHERE id = xxx
但是等等,這樣就會產(chǎn)生如你所說的資源搶奪,但如果加上一個簡單的技巧就可以避免,你把語句變成這樣
UPDATE task SET status = 1 WHERE id = xxx AND status = 0
熟悉一點數(shù)據(jù)庫的人可能會說這樣還是避免不了搶奪,只是避免了重復寫入。
我要說的是,能避免重復寫入就夠了,我們的進程在執(zhí)行完這條操作后,去獲取 affected_rows ,即更新的條數(shù),根據(jù)數(shù)據(jù)庫的原子性,只有第一個搶占的進程才會返回 1,它可以進行后面的操作。而剩下返回 0 的進程,直接進入下一個等待流程即可。
在PHP中,我們可以用array來簡單模擬隊列的功能,array_push出列,array_pop入列,但是更高效的用法還是要使用SplQueue這個官方提供的隊列類來做,記錄一下簡單的用法。
我們注意到,SplQueue中還有push和pop方法,它們與enqueue和dequeue有什么區(qū)別呢?
push和enqueue沒有區(qū)別,但是pop等同于棧的pop(FILO),每次彈出最后壓入隊列的元素。
而隊列是先進先出(FIFO)的,所以每次彈出的都是剩下的節(jié)點中先入列節(jié)點
以上是PHP隊列的簡單用法,下面是一些迭代器指針相關的操作
隊列這種數(shù)據(jù)結構更簡單,就像我們生活中排隊一樣,它的特性是先進先出(FIFO)。
PHP
SPL中SplQueue類就是實現(xiàn)隊列操作,和棧一樣,它也可以繼承雙鏈表(SplDoublyLinkedList)輕松實現(xiàn)。
SplQueue類摘要如下:
SplQueue簡單使用如下:
復制代碼
代碼如下:
$queue
=
new
SplQueue();
/**
*
可見隊列和雙鏈表的區(qū)別就是IteratorMode改變了而已,棧的IteratorMode只能為:
*
(1)SplDoublyLinkedList::IT_MODE_FIFO
|
SplDoublyLinkedList::IT_MODE_KEEP
(默認值,迭代后數(shù)據(jù)保存)
*
(2)SplDoublyLinkedList::IT_MODE_FIFO
|
SplDoublyLinkedList::IT_MODE_DELETE
(迭代后數(shù)據(jù)刪除)
*/
$queue-setIteratorMode(SplDoublyLinkedList::IT_MODE_FIFO
|
SplDoublyLinkedList::IT_MODE_DELETE);
//SplQueue::enqueue()其實就是
SplDoublyLinkedList::push()
$queue-enqueue('a');
$queue-enqueue('b');
$queue-enqueue('c');
//SplQueue::dequeue()其實就是
SplDoublyLinkedList::shift()
print_r($queue-dequeue());
foreach($queue
as
$item)
{
echo
$item
.
PHP_EOL;
}
print_r($queue);
而優(yōu)先隊列SplPriorityQueue是基于堆(后文介紹)實現(xiàn)的。
SplPriorityQueue的類摘要如下:
SplPriorityQueue簡單使用:
$pq
=
new
SplPriorityQueue();
$pq-insert('a',
10);
$pq-insert('b',
1);
$pq-insert('c',
8);
echo
$pq-count()
.PHP_EOL;
//3
echo
$pq-current()
.
PHP_EOL;
//a
/**
*
設置元素出隊模式
*
SplPriorityQueue::EXTR_DATA
僅提取值
*
SplPriorityQueue::EXTR_PRIORITY
僅提取優(yōu)先級
*
SplPriorityQueue::EXTR_BOTH
提取數(shù)組包含值和優(yōu)先級
*/
$pq-setExtractFlags(SplPriorityQueue::EXTR_DATA);
while($pq-valid())
{
print_r($pq-current());
//a
c
b
$pq-next();
}