記得Martin大叔在《企業(yè)應用架構模式》中特別強調:“能夠不分布式的應用就不要分布式”,這句話(huà)沒(méi)什么問(wèn)題,尤其對于做過(guò)分布式應用的人而言,就更會(huì )有深刻的體會(huì )了,但這個(gè)世界偏偏就沒(méi)有那么簡(jiǎn)單,大多數人都會(huì )碰到分布式應用的場(chǎng)景,尤其是對于大型應用而言,從集中式步入分布式是不可避免的,只是也許是小型分布式的,也許是大型分布式的;也許是有高性能要求的,也許是沒(méi)有的,在這篇blog中我們來(lái)看看java應用從集中式步入分布式后到底會(huì )帶來(lái)些什么挑戰。
blog按照應用從集中式演變?yōu)榇笮颓腋咝阅艿膽玫倪^(guò)程來(lái)敘述,這也是因為這幾類(lèi)應用對于設計、開(kāi)發(fā)人員的要求也是從低到高的。

Level 1:小型分布式應用
對于做習慣了集中式應用的同學(xué)而言,當碰到小型分布式應用場(chǎng)景時(shí),最明顯的問(wèn)題就是如何和遠程的系統通訊,如何發(fā)消息給遠程的系統,告訴它做什么事情,并且得到事情處理的結果,對于java開(kāi)發(fā)人員而言,更習慣的考慮方式也許是如何去調用遠程系統提供的接口,在集中式的應用中可以采用A a=new AImpl();這樣的方式調用,但遠程就沒(méi)辦法這么調用了。
在小型分布式應用中,最需要解決的就是上面所說(shuō)的遠程系統通訊以及遠程系統調用的問(wèn)題了,為此就得學(xué)習相關(guān)的知識體系。
對于遠程系統通訊而言,至少應該知道下TCP/IP、UDP/IP是個(gè)大概什么樣的概念,BIO/NIO是什么概念,另外就是需要知道下基于java如何去實(shí)現tcp/ip+BIO(NIO)、udp/ip+BIO(NIO)的通訊,相應的會(huì )需要了解下Java序列化、服務(wù)器端采用線(xiàn)程池方式處理等知識,在掌握了這些知識后,基本上做一個(gè)小型的java遠程通訊的應用不會(huì )有什么太大的問(wèn)題。
對于通過(guò)遠程系統調用就可實(shí)現的小型分布式應用而言,也許更為簡(jiǎn)單,可以只掌握怎么用spring-remoting、axis或hessian這類(lèi)的框架就可以了,直接就可實(shí)現,當然,如果能了解下rmi、webservice是什么機制就更好了,另外,畢竟遠程調用很難做到完全和本地調用一樣,盡管所有的遠程調用框架都想做到完全透明,但遠程調用時(shí)僅僅異常就比本地調用會(huì )多出好幾種來(lái),例如網(wǎng)絡(luò )異常、超時(shí)異常等,因此在調用遠程系統時(shí),需要明確的了解這些異常的區分,當然,或者可以認為都是同樣的遠程業(yè)務(wù)異常,但在追查錯誤時(shí),則需要明確區分。
從上面這些知識點(diǎn)可以看出,應用即使是從集中式應用步入小型分布式應用,無(wú)論是對于開(kāi)發(fā)、部署還是測試而言,都復雜了很多。
Level 2:高性能分布式應用
對于高性能分布式應用而言,要求就高很多了,因為要做到高性能,僅了解怎么用是不夠的,通訊和調用方面的技術(shù)都需要了解到底層的具體機制和實(shí)現。
對于遠程通訊方式的分布式應用而言,需要了解BIO/NIO具體有什么不同,具體機制是怎么樣的,以及使用或參考目前主流的通訊框架,像mina、grizzly等,看看它們在做NIO實(shí)現時(shí)有什么高超的技巧,除了了解這些外,還需要掌握線(xiàn)程池應如何配置;長(cháng)連、短連什么概念,如何實(shí)現;連接怎么管理;序列化如何優(yōu)化等等。
對于遠程調用的分布式應用而言,則在上面的基礎上,還需要了解rmi、webservice等的實(shí)現機制是怎么樣的,另外就是spring-remoting、hessian、axis的實(shí)現機制是怎么樣的,有什么可改進(jìn)的地方,在明確了可改進(jìn)的地方后需要自己選擇相應的方案去實(shí)現。
從上面這些知識點(diǎn)可以看出,要寫(xiě)出高性能的分布式應用真的不是蓋的,確實(shí)挺困難的。
Level 3:大型高性能分布式應用
對于大型高性能分布式應用而言,難度就較之之前兩個(gè)level更大很多,它面臨的問(wèn)題非常的多:
1、穩定性的問(wèn)題
對于大型分布式應用而言,保持穩定是其重點(diǎn),要做到穩定,就必須對整個(gè)應用的通訊過(guò)程的實(shí)現技術(shù)有全面的了解,以能夠做到在使用時(shí)盡量的正確,另外就是當出現問(wèn)題時(shí)能夠盡快的查明原因。
2、統一、標準通訊的問(wèn)題
大型分布式應用必然會(huì )涉及到很多種不同的應用,應該能夠做到對于任何的應用都采用同樣的方式進(jìn)行通訊或調用,這樣才能確保使用的簡(jiǎn)單。
3、分布式事務(wù)的問(wèn)題
當應用變成大型分布式應用后,分布式事務(wù)的問(wèn)題會(huì )不可避免的出現,而且這個(gè)時(shí)候還要求做到高性能,因此通常是不能用傳統的數據庫事務(wù)來(lái)實(shí)現的,目前對于大型應用的分布式事務(wù)而言,流行的有BASE和CAP策略,和傳統的ACID策略不同。
4、如何管理這些應用的問(wèn)題
大型分布式應用,意味著(zhù)應用非常的多,在這樣的場(chǎng)景下,怎么樣管理好這么多的應用呢,例如這些應用之間的依賴(lài)關(guān)系是怎么樣的,應用運行期的狀況是怎么樣的等等。
還有很多各種各樣的問(wèn)題,因此,我們更要說(shuō),要做個(gè)能支撐大型高性能的分布式應用真的非常非常的不容易,對于實(shí)現大型分布式應用而言,目前SOA是個(gè)可參考的思想,但其具體如何實(shí)現就需要各位架構師根據情況來(lái)做出具體的選擇了。
從以上簡(jiǎn)單的描述來(lái)看,可以看出,分布式應用比集中式應用真的難很多,至少它是在原有的集中式應用的基礎上增加了更多的挑戰和對于知識體系的更高的要求,當然,對于大型應用而言,它帶來(lái)的好處也是非常明顯的,因此就讓我們痛并快樂(lè )著(zhù)吧。
聯(lián)系客服