大型的PHP應用，通常使用什麽應用做消息隊列？

壹、消息隊列概述\x0d\　　消息隊列中間件是分布式系統中重要的組件，主要解決應用耦合，異步消息，流量削鋒等問題。實現高性能，高可用，可伸縮和最終壹致性架構。是大型分布式系統不可缺少的中間件。\x0d\　　目前在生產環境，使用較多的消息隊列有ActiveMQ，RabbitMQ，ZeroMQ，Kafka，MetaMQ，RocketMQ等。\x0d\　　二、消息隊列應用場景\x0d\　　以下介紹消息隊列在實際應用中常用的使用場景。異步處理，應用解耦，流量削鋒和消息通訊四個場景。\x0d\　　2.1異步處理\x0d\　　場景說明：用戶註冊後，需要發註冊郵件和註冊短信。傳統的做法有兩種1.串行的方式；2.並行方式。\x0d\　　（1）串行方式：將註冊信息寫入數據庫成功後，發送註冊郵件，再發送註冊短信。以上三個任務全部完成後，返回給客戶端。（架構KKQ：466097527，歡迎加入）\x0d\　　（2）並行方式：將註冊信息寫入數據庫成功後，發送註冊郵件的同時，發送註冊短信。以上三個任務完成後，返回給客戶端。與串行的差別是，並行的方式可以提高處理的時間。\x0d\　　假設三個業務節點每個使用50毫秒鐘，不考慮網絡等其他開銷，則串行方式的時間是150毫秒，並行的時間可能是100毫秒。\x0d\　　因為CPU在單位時間內處理的請求數是壹定的，假設CPU1秒內吞吐量是100次。則串行方式1秒內CPU可處理的請求量是7次（1000/150）。並行方式處理的請求量是10次（1000/100）。\x0d\　　小結：如以上案例描述，傳統的方式系統的性能（並發量，吞吐量，響應時間）會有瓶頸。如何解決這個問題呢？\x0d\　　引入消息隊列，將不是必須的業務邏輯，異步處理。改造後的架構如下：\x0d\　　按照以上約定，用戶的響應時間相當於是註冊信息寫入數據庫的時間，也就是50毫秒。註冊郵件，發送短信寫入消息隊列後，直接返回，因此寫入消息隊列的速度很快，基本可以忽略，因此用戶的響應時間可能是50毫秒。因此架構改變後，系統的吞吐量提高到每秒20 QPS。比串行提高了3倍，比並行提高了兩倍。\x0d\　　2.2應用解耦\x0d\　　場景說明：用戶下單後，訂單系統需要通知庫存系統。傳統的做法是，訂單系統調用庫存系統的接口。如下圖：\x0d\　　傳統模式的缺點：\x0d\　　1）假如庫存系統無法訪問，則訂單減庫存將失敗，從而導致訂單失敗；\x0d\　　2）訂單系統與庫存系統耦合；\x0d\　　如何解決以上問題呢？引入應用消息隊列後的方案，如下圖：\x0d\　　訂單系統：用戶下單後，訂單系統完成持久化處理，將消息寫入消息隊列，返回用戶訂單下單成功。\x0d\　　庫存系統：訂閱下單的消息，采用拉/推的方式，獲取下單信息，庫存系統根據下單信息，進行庫存操作。\x0d\　　假如：在下單時庫存系統不能正常使用。也不影響正常下單，因為下單後，訂單系統寫入消息隊列就不再關心其他的後續操作了。實現訂單系統與庫存系統的應用解耦。\x0d\　　2.3流量削鋒\x0d\　　流量削鋒也是消息隊列中的常用場景，壹般在秒殺或團搶活動中使用廣泛。\x0d\　　應用場景：秒殺活動，壹般會因為流量過大，導致流量暴增，應用掛掉。為解決這個問題，壹般需要在應用前端加入消息隊列。\x0d\　　可以控制活動的人數；\x0d\　　可以緩解短時間內高流量壓垮應用；\x0d\　　用戶的請求，服務器接收後，首先寫入消息隊列。假如消息隊列長度超過最大數量，則直接拋棄用戶請求或跳轉到錯誤頁面；\x0d\　　秒殺業務根據消息隊列中的請求信息，再做後續處理。\x0d\　　2.4日誌處理\x0d\　　日誌處理是指將消息隊列用在日誌處理中，比如Kafka的應用，解決大量日誌傳輸的問題。架構簡化如下：\x0d\　　日誌采集客戶端，負責日誌數據采集，定時寫受寫入Kafka隊列；\x0d\　　Kafka消息隊列，負責日誌數據的接收，存儲和轉發；\x0d\　　日誌處理應用：訂閱並消費kafka隊列中的日誌數據；\x0d\　　以下是新浪kafka日誌處理應用案例：\x0d\　　(1)Kafka：接收用戶日誌的消息隊列。\x0d\　　(2)Logstash：做日誌解析，統壹成JSON輸出給Elasticsearch。\x0d\　　(3)Elasticsearch：實時日誌分析服務的核心技術，壹個schemaless，實時的數據存儲服務，通過index組織數據，兼具強大的搜索和統計功能。\x0d\　　(4)Kibana：基於Elasticsearch的數據可視化組件，超強的數據可視化能力是眾多公司選擇ELK stack的重要原因。\x0d\　　2.5消息通訊\x0d\　　消息通訊是指，消息隊列壹般都內置了高效的通信機制，因此也可以用在純的消息通訊。比如實現點對點消息隊列，或者聊天室等。\x0d\　　點對點通訊：\x0d\　　客戶端A和客戶端B使用同壹隊列，進行消息通訊。\x0d\　　聊天室通訊：\x0d\　　客戶端A，客戶端B，客戶端N訂閱同壹主題，進行消息發布和接收。實現類似聊天室效果。\x0d\　　以上實際是消息隊列的兩種消息模式，點對點或發布訂閱模式。模型為示意圖，供參考。\x0d\　　三、消息中間件示例\x0d\　　3.1電商系統\x0d\　　消息隊列采用高可用，可持久化的消息中間件。比如Active MQ，Rabbit MQ，Rocket Mq。（1）應用將主幹邏輯處理完成後，寫入消息隊列。消息發送是否成功可以開啟消息的確認模式。（消息隊列返回消息接收成功狀態後，應用再返回，這樣保障消息的完整性）\x0d\　　（2）擴展流程（發短信，配送處理）訂閱隊列消息。采用推或拉的方式獲取消息並處理。\x0d\　　（3）消息將應用解耦的同時，帶來了數據壹致性問題，可以采用最終壹致性方式解決。比如主數據寫入數據庫，擴展應用根據消息隊列，並結合數據庫方式實現基於消息隊列的後續處理。\x0d\　　3.2日誌收集系統\x0d\　　分為Zookeeper註冊中心，日誌收集客戶端，Kafka集群和Storm集群（OtherApp）四部分組成。\x0d\　　Zookeeper註冊中心，提出負載均衡和地址查找服務；\x0d\　　日誌收集客戶端，用於采集應用系統的日誌，並將數據推送到kafka隊列；\x0d\　　四、JMS消息服務\x0d\　　講消息隊列就不得不提JMS 。JMS（Java Message Service,Java消息服務）API是壹個消息服務的標準/規範，允許應用程序組件基於JavaEE平臺創建、發送、接收和讀取消息。它使分布式通信耦合度更低，消息服務更加可靠以及異步性。\x0d\　　在EJB架構中，有消息bean可以無縫的與JM消息服務集成。在J2EE架構模式中，有消息服務者模式，用於實現消息與應用直接的解耦。\x0d\　　4.1消息模型\x0d\　　在JMS標準中，有兩種消息模型P2P（Point to Point）,Publish/Subscribe(Pub/Sub)。\x0d\　　4.1.1 P2P模式\x0d\　　P2P模式包含三個角色：消息隊列（Queue），發送者(Sender)，接收者(Receiver)。每個消息都被發送到壹個特定的隊列，接收者從隊列中獲取消息。隊列保留著消息，直到他們被消費或超時。\x0d\　　P2P的特點\x0d\　　每個消息只有壹個消費者（Consumer）(即壹旦被消費，消息就不再在消息隊列中)\x0d\　　發送者和接收者之間在時間上沒有依賴性，也就是說當發送者發送了消息之後，不管接收者有沒有正在運行，它不會影響到消息被發送到隊列\x0d\　　接收者在成功接收消息之後需向隊列應答成功\x0d\　　如果希望發送的每個消息都會被成功處理的話，那麽需要P2P模式。（架構KKQ：466097527，歡迎加入）\x0d\　　4.1.2 Pub/sub模式\x0d\　　包含三個角色主題（Topic），發布者（Publisher），訂閱者（Subscriber）。多個發布者將消息發送到Topic,系統將這些消息傳遞給多個訂閱者。\x0d\　　Pub/Sub的特點\x0d\　　每個消息可以有多個消費者\x0d\　　發布者和訂閱者之間有時間上的依賴性。針對某個主題（Topic）的訂閱者，它必須創建壹個訂閱者之後，才能消費發布者的消息。\x0d\　　為了消費消息，訂閱者必須保持運行的狀態。\x0d\　　為了緩和這樣嚴格的時間相關性，JMS允許訂閱者創建壹個可持久化的訂閱。這樣，即使訂閱者沒有被激活（運行），它也能接收到發布者的消息。\x0d\　　如果希望發送的消息可以不被做任何處理、或者只被壹個消息者處理、或者可以被多個消費者處理的話，那麽可以采用Pub/Sub模型。\x0d\　　4.2消息消費\x0d\　　在JMS中，消息的產生和消費都是異步的。對於消費來說，JMS的消息者可以通過兩種方式來消費消息。\x0d\　　（1）同步\x0d\　　訂閱者或接收者通過receive方法來接收消息，receive方法在接收到消息之前（或超時之前）將壹直阻塞；\x0d\　　（2）異步\x0d\　　訂閱者或接收者可以註冊為壹個消息監聽器。當消息到達之後，系統自動調用監聽器的onMessage方法。\x0d\　　JNDI：Java命名和目錄接口,是壹種標準的Java命名系統接口。可以在網絡上查找和訪問服務。通過指定壹個資源名稱，該名稱對應於數據庫或命名服務中的壹個記錄，同時返回資源連接建立所必須的信息。\x0d\　　JNDI在JMS中起到查找和訪問發送目標或消息來源的作用。（架構KKQ：466097527，歡迎加入）\x0d\　　4.3JMS編程模型\x0d\　　(1) ConnectionFactory\x0d\　　創建Connection對象的工廠，針對兩種不同的jms消息模型，分別有QueueConnectionFactory和TopicConnectionFactory兩種。可以通過JNDI來查找ConnectionFactory對象。\x0d\　　(2) Destination\x0d\　　Destination的意思是消息生產者的消息發送目標或者說消息消費者的消息來源。對於消息生產者來說，它的Destination是某個隊列（Queue）或某個主題（Topic）;對於消息消費者來說，它的Destination也是某個隊列或主題（即消息來源）。\x0d\　　所以，Destination實際上就是兩種類型的對象：Queue、Topic可以通過JNDI來查找Destination。\x0d\　　(3) Connection\x0d\　　Connection表示在客戶端和JMS系統之間建立的鏈接（對TCP/IP socket的包裝）。Connection可以產生壹個或多個Session。跟ConnectionFactory壹樣，Connection也有兩種類型：QueueConnection和TopicConnection。\x0d\　　(4) Session\x0d\　　Session是操作消息的接口。可以通過session創建生產者、消費者、消息等。Session提供了事務的功能。當需要使用session發送/接收多個消息時，可以將這些發送/接收動作放到壹個事務中。同樣，也分QueueSession和TopicSession。\x0d\　　(5) 消息的生產者\x0d\　　消息生產者由Session創建，並用於將消息發送到Destination。同樣，消息生產者分兩種類型：QueueSender和TopicPublisher。可以調用消息生產者的方法（send或publish方法）發送消息。\x0d\　　(6) 消息消費者\x0d\　　消息消費者由Session創建，用於接收被發送到Destination的消息。兩種類型：QueueReceiver和TopicSubscriber。可分別通過session的createReceiver(Queue)或createSubscriber(Topic)來創建。當然，也可以session的creatDurableSubscriber方法來創建持久化的訂閱者。\x0d\　　(7) MessageListener\x0d\　　消息監聽器。如果註冊了消息監聽器，壹旦消息到達，將自動調用監聽器的onMessage方法。EJB中的MDB（Message-Driven Bean）就是壹種MessageListener。\x0d\　　深入學習JMS對掌握JAVA架構，EJB架構有很好的幫助，消息中間件也是大型分布式系統必須的組件。本次分享主要做全局性介紹，具體的深入需要大家學習，實踐，總結，領會。\x0d\　　五、常用消息隊列\x0d\　　壹般商用的容器，比如WebLogic，JBoss，都支持JMS標準，開發上很方便。但免費的比如Tomcat，Jetty等則需要使用第三方的消息中間件。本部分內容介紹常用的消息中間件（Active MQ,Rabbit MQ，Zero MQ,Kafka）以及他們的特點。\x0d\　　5.1 ActiveMQ\x0d\　　ActiveMQ 是Apache出品，最流行的，能力強勁的開源消息總線。ActiveMQ 是壹個完全支持JMS1.1和J2EE 1.4規範的 JMS Provider實現，盡管JMS規範出臺已經是很久的事情了，但是JMS在當今的J2EE應用中間仍然扮演著特殊的地位。\x0d\　　ActiveMQ特性如下：\x0d\　　⒈ 多種語言和協議編寫客戶端。語言: Java,C,C++,C#,Ruby,Perl,Python,PHP。應用協議： OpenWire,Stomp REST,WS Notification,XMPP,AMQP\x0d\　　⒉ 完全支持JMS1.1和J2EE 1.4規範（持久化，XA消息，事務)\x0d\　　⒊ 對spring的支持，ActiveMQ可以很容易內嵌到使用Spring的系統裏面去，而且也支持Spring2.0的特性\x0d\　　⒋ 通過了常見J2EE服務器（如 Geronimo,JBoss 4,GlassFish,WebLogic)的測試，其中通過JCA 1.5 resource adaptors的配置，可以讓ActiveMQ可以自動的部署到任何兼容J2EE 1.4 商業服務器上\x0d\　　⒌ 支持多種傳送協議：in-VM,TCP,SSL,NIO,UDP,JGroups,JXTA\x0d\　　⒍ 支持通過JDBC和journal提供高速的消息持久化\x0d\　　⒎ 從設計上保證了高性能的集群，客戶端-服務器，點對點\x0d\　　⒏ 支持Ajax\x0d\　　⒐ 支持與Axis的整合\x0d\　　⒑ 可以很容易得調用內嵌JMS provider，進行測試\x0d\　　5.2 RabbitMQ\x0d\　　RabbitMQ是流行的開源消息隊列系統，用erlang語言開發。RabbitMQ是AMQP（高級消息隊列協議）的標準實現。支持多種客戶端，如：Python、Ruby、.NET、Java、JMS、C、PHP、ActionScript、XMPP、STOMP等，支持AJAX，持久化。用於在分布式系統中存儲轉發消息，在易用性、擴展性、高可用性等方面表現不俗。\x0d\　　幾個重要概念：\x0d\　　Broker：簡單來說就是消息隊列服務器實體。\x0d\　　Exchange：消息交換機，它指定消息按什麽規則，路由到哪個隊列。\x0d\　　Queue：消息隊列載體，每個消息都會被投入到壹個或多個隊列。\x0d\　　Binding：綁定，它的作用就是把exchange和queue按照路由規則綁定起來。\x0d\　　Routing Key：路由關鍵字，exchange根據這個關鍵字進行消息投遞。\x0d\　　vhost：虛擬主機，壹個broker裏可以開設多個vhost，用作不同用戶的權限分離。\x0d\　　producer：消息生產者，就是投遞消息的程序。\x0d\　　consumer：消息消費者，就是接受消息的程序。\x0d\　　channel：消息通道，在客戶端的每個連接裏，可建立多個channel，每個channel代表壹個會話任務。\x0d\　　消息隊列的使用過程，如下：\x0d\　　（1）客戶端連接到消息隊列服務器，打開壹個channel。\x0d\　　（2）客戶端聲明壹個exchange，並設置相關屬性。\x0d\　　（3）客戶端聲明壹個queue，並設置相關屬性。\x0d\　　（4）客戶端使用routing key，在exchange和queue之間建立好綁定關系。\x0d\　　（5）客戶端投遞消息到exchange。\x0d\　　exchange接收到消息後，就根據消息的key和已經設置的binding，進行消息路由，將消息投遞到壹個或多個隊列裏。\x0d\　　5.3 ZeroMQ\x0d\　　號稱史上最快的消息隊列，它實際類似於Socket的壹系列接口，他跟Socket的區別是：普通的socket是端到端的（1:1的關系），而ZMQ卻是可以N：M 的關系，人們對BSD套接字的了解較多的是點對點的連接，點對點連接需要顯式地建立連接、銷毀連接、選擇協議（TCP/UDP）和處理錯誤等，而ZMQ屏蔽了這些細節，讓妳的網絡編程更為簡單。ZMQ用於node與node間的通信，node可以是主機或者是進程。\x0d\　　引用官方的說法： “ZMQ(以下ZeroMQ簡稱ZMQ)是壹個簡單好用的傳輸層，像框架壹樣的壹個socket library，他使得Socket編程更加簡單、簡潔和性能更高。是壹個消息處理隊列庫，可在多個線程、內核和主機盒之間彈性伸縮。ZMQ的明確目標是“成為標準網絡協議棧的壹部分，之後進入Linux內核”。現在還未看到它們的成功。但是，它無疑是極具前景的、並且是人們更加需要的“傳統”BSD套接字之上的壹層封裝。ZMQ讓編寫高性能網絡應用程序極為簡單和有趣。”\x0d\　　特點是：\x0d\　　高性能，非持久化；\x0d\　　跨平臺：支持Linux、Windows、OS X等。\x0d\　　多語言支持； C、C++、Java、.NET、Python等30多種開發語言。\x0d\　　可單獨部署或集成到應用中使用；\x0d\　　可作為Socket通信庫使用。\x0d\　　與RabbitMQ相比，ZMQ並不像是壹個傳統意義上的消息隊列服務器，事實上，它也根本不是壹個服務器，更像壹個底層的網絡通訊庫，在Socket API之上做了壹層封裝，將網絡通訊、進程通訊和線程通訊抽象為統壹的API接口。支持“Request-Reply “，”Publisher-Subscriber“，”Parallel Pipeline”三種基本模型和擴展模型。\x0d\　　ZeroMQ高性能設計要點：\x0d\　　1、無鎖的隊列模型\x0d\　　對於跨線程間的交互（用戶端和session）之間的數據交換通道pipe，采用無鎖的隊列算法CAS；在pipe兩端註冊有異步事件，在讀或者寫消息到pipe的時，會自動觸發讀寫事件。\x0d\　　2、批量處理的算法\x0d\　　對於傳統的消息處理，每個消息在發送和接收的時候，都需要系統的調用，這樣對於大量的消息，系統的開銷比較大，zeroMQ對於批量的消息，進行了適應性的優化，可以批量的接收和發送消息。\x0d\　　3、多核下的線程綁定，無須CPU切換\x0d\　　區別於傳統的多線程並發模式，信號量或者臨界區， zeroMQ充分利用多核的優勢，每個核綁定運行壹個工作者線程，避免多線程之間的CPU切換開銷。\x0d\　　5.4 Kafka\x0d\　　Kafka是壹種高吞吐量的分布式發布訂閱消息系統，它可以處理消費者規模的網站中的所有動作流數據。這種動作（網頁瀏覽，搜索和其他用戶的行動）是在現代網絡上的許多社會功能的壹個關鍵因素。這些數據通常是由於吞吐量的要求而通過處理日誌和日誌聚合來解決。對於像Hadoop的壹樣的日誌數據和離線分析系統，但又要求實時處理的限制，這是壹個可行的解決方案。Kafka的目的是通過Hadoop的並行加載機制來統壹線上和離線的消息處理，也是為了通過集群機來提供實時的消費。\x0d\　　Kafka是壹種高吞吐量的分布式發布訂閱消息系統，有如下特性：\x0d\　　通過O(1)的磁盤數據結構提供消息的持久化，這種結構對於即使數以TB的消息存儲也能夠保持長時間的穩定性能。（文件追加的方式寫入數據，過期的數據定期刪除）\x0d\　　高吞吐量：即使是非常普通的硬件Kafka也可以支持每秒數百萬的消息。\x0d\　　支持通過Kafka服務器和消費機集群來分區消息。\x0d\　　支持Hadoop並行數據加載。\x0d\　　Kafka相關概念\x0d\　　Broker\x0d\　　Kafka集群包含壹個或多個服務器，這種服務器被稱為broker[5]\x0d\　　Topic\x0d\　　每條發布到Kafka集群的消息都有壹個類別，這個類別被稱為Topic。（物理上不同Topic的消息分開存儲，邏輯上壹個Topic的消息雖然保存於壹個或多個broker上但用戶只需指定消息的Topic即可生產或消費數據而不必關心數據存於何處）\x0d\　　Partition\x0d\　　Parition是物理上的概念，每個Topic包含壹個或多個Partition.\x0d\　　Producer\x0d\　　負責發布消息到Kafka broker\x0d\　　Consumer\x0d\　　消息消費者，向Kafka broker讀取消息的客戶端。\x0d\　　Consumer Group\x0d\　　每個Consumer屬於壹個特定的Consumer Group（可為每個Consumer指定group name，若不指定group name則屬於默認的group）。\x0d\　　壹般應用在大數據日誌處理或對實時性（少量延遲），可靠性（少量丟數據）要求稍低的場景使用。