(點(diǎn)擊上方公號,可快速關(guān)注)
出處:ITFLY8
網(wǎng)址:http://www.cnblogs.com/itfly8/p/5156155.html
一、消息隊列概述
消息隊列中間件是分布式系統中重要的組件,主要解決應用耦合,異步消息,流量削鋒等問(wèn)題。實(shí)現高性能,高可用,可伸縮和最終一致性架構。是大型分布式系統不可缺少的中間件。
目前在生產(chǎn)環(huán)境,使用較多的消息隊列有ActiveMQ,RabbitMQ,ZeroMQ,Kafka,MetaMQ,RocketMQ等。
以下介紹消息隊列在實(shí)際應用中常用的使用場(chǎng)景。異步處理,應用解耦,流量削鋒和消息通訊四個(gè)場(chǎng)景。
場(chǎng)景說(shuō)明:用戶(hù)注冊后,需要發(fā)注冊郵件和注冊短信。傳統的做法有兩種1.串行的方式;2.并行方式。
(1)串行方式:將注冊信息寫(xiě)入數據庫成功后,發(fā)送注冊郵件,再發(fā)送注冊短信。以上三個(gè)任務(wù)全部完成后,返回給客戶(hù)端。
(2)并行方式:將注冊信息寫(xiě)入數據庫成功后,發(fā)送注冊郵件的同時(shí),發(fā)送注冊短信。以上三個(gè)任務(wù)完成后,返回給客戶(hù)端。與串行的差別是,并行的方式可以提高處理的時(shí)間。
假設三個(gè)業(yè)務(wù)節點(diǎn)每個(gè)使用50毫秒鐘,不考慮網(wǎng)絡(luò )等其他開(kāi)銷(xiāo),則串行方式的時(shí)間是150毫秒,并行的時(shí)間可能是100毫秒。
因為CPU在單位時(shí)間內處理的請求數是一定的,假設CPU1秒內吞吐量是100次。則串行方式1秒內CPU可處理的請求量是7次(1000/150)。并行方式處理的請求量是10次(1000/100)。
小結:如以上案例描述,傳統的方式系統的性能(并發(fā)量,吞吐量,響應時(shí)間)會(huì )有瓶頸。如何解決這個(gè)問(wèn)題呢?
引入消息隊列,將不是必須的業(yè)務(wù)邏輯,異步處理。改造后的架構如下:
按照以上約定,用戶(hù)的響應時(shí)間相當于是注冊信息寫(xiě)入數據庫的時(shí)間,也就是50毫秒。注冊郵件,發(fā)送短信寫(xiě)入消息隊列后,直接返回,因此寫(xiě)入消息隊列的速度很快,基本可以忽略,因此用戶(hù)的響應時(shí)間可能是50毫秒。因此架構改變后,系統的吞吐量提高到每秒20 QPS。比串行提高了3倍,比并行提高了兩倍。
場(chǎng)景說(shuō)明:用戶(hù)下單后,訂單系統需要通知庫存系統。傳統的做法是,訂單系統調用庫存系統的接口。如下圖:
傳統模式的缺點(diǎn):
1) 假如庫存系統無(wú)法訪(fǎng)問(wèn),則訂單減庫存將失敗,從而導致訂單失??;
2) 訂單系統與庫存系統耦合;
如何解決以上問(wèn)題呢?引入應用消息隊列后的方案,如下圖:
訂單系統:用戶(hù)下單后,訂單系統完成持久化處理,將消息寫(xiě)入消息隊列,返回用戶(hù)訂單下單成功。
庫存系統:訂閱下單的消息,采用拉/推的方式,獲取下單信息,庫存系統根據下單信息,進(jìn)行庫存操作。
假如:在下單時(shí)庫存系統不能正常使用。也不影響正常下單,因為下單后,訂單系統寫(xiě)入消息隊列就不再關(guān)心其他的后續操作了。實(shí)現訂單系統與庫存系統的應用解耦。
流量削鋒也是消息隊列中的常用場(chǎng)景,一般在秒殺或團搶活動(dòng)中使用廣泛。
應用場(chǎng)景:秒殺活動(dòng),一般會(huì )因為流量過(guò)大,導致流量暴增,應用掛掉。為解決這個(gè)問(wèn)題,一般需要在應用前端加入消息隊列。
可以控制活動(dòng)的人數;
可以緩解短時(shí)間內高流量壓垮應用;

用戶(hù)的請求,服務(wù)器接收后,首先寫(xiě)入消息隊列。假如消息隊列長(cháng)度超過(guò)最大數量,則直接拋棄用戶(hù)請求或跳轉到錯誤頁(yè)面;
秒殺業(yè)務(wù)根據消息隊列中的請求信息,再做后續處理。
日志處理是指將消息隊列用在日志處理中,比如Kafka的應用,解決大量日志傳輸的問(wèn)題。架構簡(jiǎn)化如下:

日志采集客戶(hù)端,負責日志數據采集,定時(shí)寫(xiě)受寫(xiě)入Kafka隊列;
Kafka消息隊列,負責日志數據的接收,存儲和轉發(fā);
日志處理應用:訂閱并消費kafka隊列中的日志數據;
以下是新浪kafka日志處理應用案例:

(1)Kafka:接收用戶(hù)日志的消息隊列。
(2)Logstash:做日志解析,統一成JSON輸出給Elasticsearch。
(3)Elasticsearch:實(shí)時(shí)日志分析服務(wù)的核心技術(shù),一個(gè)schemaless,實(shí)時(shí)的數據存儲服務(wù),通過(guò)index組織數據,兼具強大的搜索和統計功能。
(4)Kibana:基于Elasticsearch的數據可視化組件,超強的數據可視化能力是眾多公司選擇ELK stack的重要原因。
消息通訊是指,消息隊列一般都內置了高效的通信機制,因此也可以用在純的消息通訊。比如實(shí)現點(diǎn)對點(diǎn)消息隊列,或者聊天室等。
點(diǎn)對點(diǎn)通訊:

客戶(hù)端A和客戶(hù)端B使用同一隊列,進(jìn)行消息通訊。
聊天室通訊:

客戶(hù)端A,客戶(hù)端B,客戶(hù)端N訂閱同一主題,進(jìn)行消息發(fā)布和接收。實(shí)現類(lèi)似聊天室效果。
以上實(shí)際是消息隊列的兩種消息模式,點(diǎn)對點(diǎn)或發(fā)布訂閱模式。模型為示意圖,供參考。

消息隊列采用高可用,可持久化的消息中間件。比如Active MQ,Rabbit MQ,Rocket Mq。(1)應用將主干邏輯處理完成后,寫(xiě)入消息隊列。消息發(fā)送是否成功可以開(kāi)啟消息的確認模式。(消息隊列返回消息接收成功狀態(tài)后,應用再返回,這樣保障消息的完整性)
(2)擴展流程(發(fā)短信,配送處理)訂閱隊列消息。采用推或拉的方式獲取消息并處理。
(3)消息將應用解耦的同時(shí),帶來(lái)了數據一致性問(wèn)題,可以采用最終一致性方式解決。比如主數據寫(xiě)入數據庫,擴展應用根據消息隊列,并結合數據庫方式實(shí)現基于消息隊列的后續處理。

分為Zookeeper注冊中心,日志收集客戶(hù)端,Kafka集群和Storm集群(OtherApp)四部分組成。
Zookeeper注冊中心,提出負載均衡和地址查找服務(wù);
日志收集客戶(hù)端,用于采集應用系統的日志,并將數據推送到kafka隊列;
四、JMS消息服務(wù)
講消息隊列就不得不提JMS 。JMS(JAVA Message Service,java消息服務(wù))API是一個(gè)消息服務(wù)的標準/規范,允許應用程序組件基于JavaEE平臺創(chuàng )建、發(fā)送、接收和讀取消息。它使分布式通信耦合度更低,消息服務(wù)更加可靠以及異步性。
在EJB架構中,有消息bean可以無(wú)縫的與JM消息服務(wù)集成。在J2EE架構模式中,有消息服務(wù)者模式,用于實(shí)現消息與應用直接的解耦。
在JMS標準中,有兩種消息模型P2P(Point to Point),Publish/Subscribe(Pub/Sub)。

P2P模式包含三個(gè)角色:消息隊列(Queue),發(fā)送者(Sender),接收者(Receiver)。每個(gè)消息都被發(fā)送到一個(gè)特定的隊列,接收者從隊列中獲取消息。隊列保留著(zhù)消息,直到他們被消費或超時(shí)。
P2P的特點(diǎn)
每個(gè)消息只有一個(gè)消費者(Consumer)(即一旦被消費,消息就不再在消息隊列中)
發(fā)送者和接收者之間在時(shí)間上沒(méi)有依賴(lài)性,也就是說(shuō)當發(fā)送者發(fā)送了消息之后,不管接收者有沒(méi)有正在運行,它不會(huì )影響到消息被發(fā)送到隊列
接收者在成功接收消息之后需向隊列應答成功
如果希望發(fā)送的每個(gè)消息都會(huì )被成功處理的話(huà),那么需要P2P模式。

包含三個(gè)角色主題(Topic),發(fā)布者(Publisher),訂閱者(Subscriber) 。多個(gè)發(fā)布者將消息發(fā)送到Topic,系統將這些消息傳遞給多個(gè)訂閱者。
Pub/Sub的特點(diǎn)
每個(gè)消息可以有多個(gè)消費者
發(fā)布者和訂閱者之間有時(shí)間上的依賴(lài)性。針對某個(gè)主題(Topic)的訂閱者,它必須創(chuàng )建一個(gè)訂閱者之后,才能消費發(fā)布者的消息。
為了消費消息,訂閱者必須保持運行的狀態(tài)。
為了緩和這樣嚴格的時(shí)間相關(guān)性,JMS允許訂閱者創(chuàng )建一個(gè)可持久化的訂閱。這樣,即使訂閱者沒(méi)有被激活(運行),它也能接收到發(fā)布者的消息。
如果希望發(fā)送的消息可以不被做任何處理、或者只被一個(gè)消息者處理、或者可以被多個(gè)消費者處理的話(huà),那么可以采用Pub/Sub模型。
在JMS中,消息的產(chǎn)生和消費都是異步的。對于消費來(lái)說(shuō),JMS的消息者可以通過(guò)兩種方式來(lái)消費消息。
(1)同步
訂閱者或接收者通過(guò)receive方法來(lái)接收消息,receive方法在接收到消息之前(或超時(shí)之前)將一直阻塞;
(2)異步
訂閱者或接收者可以注冊為一個(gè)消息監聽(tīng)器。當消息到達之后,系統自動(dòng)調用監聽(tīng)器的onMessage方法。
JNDI:Java命名和目錄接口,是一種標準的Java命名系統接口??梢栽诰W(wǎng)絡(luò )上查找和訪(fǎng)問(wèn)服務(wù)。通過(guò)指定一個(gè)資源名稱(chēng),該名稱(chēng)對應于數據庫或命名服務(wù)中的一個(gè)記錄,同時(shí)返回資源連接建立所必須的信息。
JNDI在JMS中起到查找和訪(fǎng)問(wèn)發(fā)送目標或消息來(lái)源的作用。
(1) ConnectionFactory
創(chuàng )建Connection對象的工廠(chǎng),針對兩種不同的jms消息模型,分別有QueueConnectionFactory和TopicConnectionFactory兩種??梢酝ㄟ^(guò)JNDI來(lái)查找ConnectionFactory對象。
(2) Destination
Destination的意思是消息生產(chǎn)者的消息發(fā)送目標或者說(shuō)消息消費者的消息來(lái)源。對于消息生產(chǎn)者來(lái)說(shuō),它的Destination是某個(gè)隊列(Queue)或某個(gè)主題(Topic);對于消息消費者來(lái)說(shuō),它的Destination也是某個(gè)隊列或主題(即消息來(lái)源)。
所以,Destination實(shí)際上就是兩種類(lèi)型的對象:Queue、Topic可以通過(guò)JNDI來(lái)查找Destination。
(3) Connection
Connection表示在客戶(hù)端和JMS系統之間建立的鏈接(對TCP/IP socket的包裝)。Connection可以產(chǎn)生一個(gè)或多個(gè)Session。跟ConnectionFactory一樣,Connection也有兩種類(lèi)型:QueueConnection和TopicConnection。
(4) Session
Session是操作消息的接口??梢酝ㄟ^(guò)session創(chuàng )建生產(chǎn)者、消費者、消息等。Session提供了事務(wù)的功能。當需要使用session發(fā)送/接收多個(gè)消息時(shí),可以將這些發(fā)送/接收動(dòng)作放到一個(gè)事務(wù)中。同樣,也分QueueSession和TopicSession。
(5) 消息的生產(chǎn)者
消息生產(chǎn)者由Session創(chuàng )建,并用于將消息發(fā)送到Destination。同樣,消息生產(chǎn)者分兩種類(lèi)型:QueueSender和TopicPublisher??梢哉{用消息生產(chǎn)者的方法(send或publish方法)發(fā)送消息。
(6) 消息消費者
消息消費者由Session創(chuàng )建,用于接收被發(fā)送到Destination的消息。兩種類(lèi)型:QueueReceiver和TopicSubscriber??煞謩e通過(guò)session的createReceiver(Queue)或createSubscriber(Topic)來(lái)創(chuàng )建。當然,也可以session的creatDurableSubscriber方法來(lái)創(chuàng )建持久化的訂閱者。
(7) MessageListener
消息監聽(tīng)器。如果注冊了消息監聽(tīng)器,一旦消息到達,將自動(dòng)調用監聽(tīng)器的onMessage方法。EJB中的MDB(Message-Driven Bean)就是一種MessageListener。
深入學(xué)習JMS對掌握JAVA架構,EJB架構有很好的幫助,消息中間件也是大型分布式系統必須的組件。本次分享主要做全局性介紹,具體的深入需要大家學(xué)習,實(shí)踐,總結,領(lǐng)會(huì )。
一般商用的容器,比如WebLogic,JBoss,都支持JMS標準,開(kāi)發(fā)上很方便。但免費的比如Tomcat,Jetty等則需要使用第三方的消息中間件。本部分內容介紹常用的消息中間件(Active MQ,Rabbit MQ,Zero MQ,Kafka)以及他們的特點(diǎn)。
ActiveMQ 是Apache出品,最流行的,能力強勁的開(kāi)源消息總線(xiàn)。ActiveMQ 是一個(gè)完全支持JMS1.1和J2EE 1.4規范的 JMS Provider實(shí)現,盡管JMS規范出臺已經(jīng)是很久的事情了,但是JMS在當今的J2EE應用中間仍然扮演著(zhù)特殊的地位。
ActiveMQ特性如下:
⒈ 多種語(yǔ)言和協(xié)議編寫(xiě)客戶(hù)端。語(yǔ)言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協(xié)議: OpenWire,Stomp REST,WS Notification,XMPP,AMQP
⒉ 完全支持JMS1.1和J2EE 1.4規范 (持久化,XA消息,事務(wù))
⒊ 對Spring的支持,ActiveMQ可以很容易內嵌到使用Spring的系統里面去,而且也支持Spring2.0的特性
⒋ 通過(guò)了常見(jiàn)J2EE服務(wù)器(如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試,其中通過(guò)JCA 1.5 resource adaptors的配置,可以讓ActiveMQ可以自動(dòng)的部署到任何兼容J2EE 1.4 商業(yè)服務(wù)器上
⒌ 支持多種傳送協(xié)議:in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA
⒍ 支持通過(guò)JDBC和journal提供高速的消息持久化
⒎ 從設計上保證了高性能的集群,客戶(hù)端-服務(wù)器,點(diǎn)對點(diǎn)
⒏ 支持Ajax
⒐ 支持與Axis的整合
⒑ 可以很容易得調用內嵌JMS provider,進(jìn)行測試
RabbitMQ是流行的開(kāi)源消息隊列系統,用erlang語(yǔ)言開(kāi)發(fā)。RabbitMQ是AMQP(高級消息隊列協(xié)議)的標準實(shí)現。支持多種客戶(hù)端,如:Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等,支持AJAX,持久化。用于在分布式系統中存儲轉發(fā)消息,在易用性、擴展性、高可用性等方面表現不俗。
結構圖如下:

幾個(gè)重要概念:
Broker:簡(jiǎn)單來(lái)說(shuō)就是消息隊列服務(wù)器實(shí)體。
Exchange:消息交換機,它指定消息按什么規則,路由到哪個(gè)隊列。
Queue:消息隊列載體,每個(gè)消息都會(huì )被投入到一個(gè)或多個(gè)隊列。
Binding:綁定,它的作用就是把exchange和queue按照路由規則綁定起來(lái)。
Routing Key:路由關(guān)鍵字,exchange根據這個(gè)關(guān)鍵字進(jìn)行消息投遞。
vhost:虛擬主機,一個(gè)broker里可以開(kāi)設多個(gè)vhost,用作不同用戶(hù)的權限分離。
producer:消息生產(chǎn)者,就是投遞消息的程序。
consumer:消息消費者,就是接受消息的程序。
channel:消息通道,在客戶(hù)端的每個(gè)連接里,可建立多個(gè)channel,每個(gè)channel代表一個(gè)會(huì )話(huà)任務(wù)。
消息隊列的使用過(guò)程,如下:
(1)客戶(hù)端連接到消息隊列服務(wù)器,打開(kāi)一個(gè)channel。
(2)客戶(hù)端聲明一個(gè)exchange,并設置相關(guān)屬性。
(3)客戶(hù)端聲明一個(gè)queue,并設置相關(guān)屬性。
(4)客戶(hù)端使用routing key,在exchange和queue之間建立好綁定關(guān)系。
(5)客戶(hù)端投遞消息到exchange。
exchange接收到消息后,就根據消息的key和已經(jīng)設置的binding,進(jìn)行消息路由,將消息投遞到一個(gè)或多個(gè)隊列里。
號稱(chēng)史上最快的消息隊列,它實(shí)際類(lèi)似于Socket的一系列接口,他跟Socket的區別是:普通的socket是端到端的(1:1的關(guān)系),而ZMQ卻是可以N:M 的關(guān)系,人們對BSD套接字的了解較多的是點(diǎn)對點(diǎn)的連接,點(diǎn)對點(diǎn)連接需要顯式地建立連接、銷(xiāo)毀連接、選擇協(xié)議(TCP/UDP)和處理錯誤等,而ZMQ屏蔽了這些細節,讓你的網(wǎng)絡(luò )編程更為簡(jiǎn)單。ZMQ用于node與node間的通信,node可以是主機或者是進(jìn)程。
引用官方的說(shuō)法: “ZMQ(以下ZeroMQ簡(jiǎn)稱(chēng)ZMQ)是一個(gè)簡(jiǎn)單好用的傳輸層,像框架一樣的一個(gè)socket library,他使得Socket編程更加簡(jiǎn)單、簡(jiǎn)潔和性能更高。是一個(gè)消息處理隊列庫,可在多個(gè)線(xiàn)程、內核和主機盒之間彈性伸縮。ZMQ的明確目標是“成為標準網(wǎng)絡(luò )協(xié)議棧的一部分,之后進(jìn)入Linux內核”?,F在還未看到它們的成功。但是,它無(wú)疑是極具前景的、并且是人們更加需要的“傳統”BSD套接字之上的一 層封裝。ZMQ讓編寫(xiě)高性能網(wǎng)絡(luò )應用程序極為簡(jiǎn)單和有趣?!?/p>
特點(diǎn)是:
高性能,非持久化;
跨平臺:支持Linux、Windows、OS X等。
多語(yǔ)言支持; C、C++、Java、.NET、Python等30多種開(kāi)發(fā)語(yǔ)言。
可單獨部署或集成到應用中使用;
可作為Socket通信庫使用。
與RabbitMQ相比,ZMQ并不像是一個(gè)傳統意義上的消息隊列服務(wù)器,事實(shí)上,它也根本不是一個(gè)服務(wù)器,更像一個(gè)底層的網(wǎng)絡(luò )通訊庫,在Socket API之上做了一層封裝,將網(wǎng)絡(luò )通訊、進(jìn)程通訊和線(xiàn)程通訊抽象為統一的API接口。支持“Request-Reply “,”P(pán)ublisher-Subscriber“,”P(pán)arallel Pipeline”三種基本模型和擴展模型。
ZeroMQ高性能設計要點(diǎn):
1、無(wú)鎖的隊列模型
對于跨線(xiàn)程間的交互(用戶(hù)端和session)之間的數據交換通道pipe,采用無(wú)鎖的隊列算法CAS;在pipe兩端注冊有異步事件,在讀或者寫(xiě)消息到pipe的時(shí),會(huì )自動(dòng)觸發(fā)讀寫(xiě)事件。
2、批量處理的算法
對于傳統的消息處理,每個(gè)消息在發(fā)送和接收的時(shí)候,都需要系統的調用,這樣對于大量的消息,系統的開(kāi)銷(xiāo)比較大,zeroMQ對于批量的消息,進(jìn)行了適應性的優(yōu)化,可以批量的接收和發(fā)送消息。
3、多核下的線(xiàn)程綁定,無(wú)須CPU切換
區別于傳統的多線(xiàn)程并發(fā)模式,信號量或者臨界區, zeroMQ充分利用多核的優(yōu)勢,每個(gè)核綁定運行一個(gè)工作者線(xiàn)程,避免多線(xiàn)程之間的CPU切換開(kāi)銷(xiāo)。
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統,它可以處理消費者規模的網(wǎng)站中的所有動(dòng)作流數據。 這種動(dòng)作(網(wǎng)頁(yè)瀏覽,搜索和其他用戶(hù)的行動(dòng))是在現代網(wǎng)絡(luò )上的許多社會(huì )功能的一個(gè)關(guān)鍵因素。 這些數據通常是由于吞吐量的要求而通過(guò)處理日志和日志聚合來(lái)解決。 對于像Hadoop的一樣的日志數據和離線(xiàn)分析系統,但又要求實(shí)時(shí)處理的限制,這是一個(gè)可行的解決方案。Kafka的目的是通過(guò)Hadoop的并行加載機制來(lái)統一線(xiàn)上和離線(xiàn)的消息處理,也是為了通過(guò)集群機來(lái)提供實(shí)時(shí)的消費。
Kafka是一種高吞吐量的分布式發(fā)布訂閱消息系統,有如下特性:
通過(guò)O(1)的磁盤(pán)數據結構提供消息的持久化,這種結構對于即使數以TB的消息存儲也能夠保持長(cháng)時(shí)間的穩定性能。(文件追加的方式寫(xiě)入數據,過(guò)期的數據定期刪除)
高吞吐量:即使是非常普通的硬件Kafka也可以支持每秒數百萬(wàn)的消息。
支持通過(guò)Kafka服務(wù)器和消費機集群來(lái)分區消息。
支持Hadoop并行數據加載。
Kafka相關(guān)概念
Broker
Kafka集群包含一個(gè)或多個(gè)服務(wù)器,這種服務(wù)器被稱(chēng)為broker
Topic
每條發(fā)布到Kafka集群的消息都有一個(gè)類(lèi)別,這個(gè)類(lèi)別被稱(chēng)為T(mén)opic。(物理上不同Topic的消息分開(kāi)存儲,邏輯上一個(gè)Topic的消息雖然保存于一個(gè)或多個(gè)broker上但用戶(hù)只需指定消息的Topic即可生產(chǎn)或消費數據而不必關(guān)心數據存于何處)
Partition
Parition是物理上的概念,每個(gè)Topic包含一個(gè)或多個(gè)Partition.
Producer
負責發(fā)布消息到Kafka broker
Consumer
消息消費者,向Kafka broker讀取消息的客戶(hù)端。
Consumer Group
每個(gè)Consumer屬于一個(gè)特定的Consumer Group(可為每個(gè)Consumer指定group name,若不指定group name則屬于默認的group)。
一般應用在大數據日志處理或對實(shí)時(shí)性(少量延遲),可靠性(少量丟數據)要求稍低的場(chǎng)景使用。
【今日微信公號推薦↓】
更多推薦請看《值得關(guān)注的技術(shù)和設計公眾號》
其中推薦了包括技術(shù)、設計、極客 和 IT相親相關(guān)的熱門(mén)公眾號。技術(shù)涵蓋:Python、Web前端、Java、安卓、iOS、PHP、C/C++、.NET、Linux、數據庫、運維、大數據、算法、IT職場(chǎng)等。點(diǎn)擊《值得關(guān)注的技術(shù)和設計公眾號》,發(fā)現精彩!
聯(lián)系客服