網(wǎng)格體系結構與語(yǔ)義網(wǎng)格體系結構初探
摘要
網(wǎng)格作為人們的一種理想,從計算機產(chǎn)生以來(lái)人們一直追求著(zhù)。隨著(zhù)各種科學(xué)計算的需求,網(wǎng)格的呼聲越來(lái)越高。網(wǎng)格計算從數據網(wǎng)格發(fā)展到信息網(wǎng)格,并對知識網(wǎng)格的認識越來(lái)越明確。網(wǎng)格的迷人之處,除了它有著(zhù)跟電力網(wǎng)格同樣特質(zhì)的應用前景之外,更多的是在于它的許多不確定性,以及技術(shù)與理論上的爭議。本文通過(guò)對網(wǎng)格的發(fā)展演化過(guò)程的研讀,幾種常見(jiàn)的網(wǎng)格體系結構,著(zhù)重對OGSA和語(yǔ)義網(wǎng)格進(jìn)行了闡述。
關(guān)鍵字 網(wǎng)格計算 沙漏模型 OGSA 語(yǔ)義網(wǎng)格
The Elementary Research of Grid Architecture and The Semantic Grid Architecture
Abstract:
As our dream, we pursue for its attractiveness since the computer was invented. Along with the increasing requirements of all kinds of scientific computing, grid’s development becomes more and more important. Meanwhile, Grid computing evolves from data grid to information
Grid, and scientists and engineers get to know Knowledge grid. The charm of Grid, except for the future application like electronic grid, lies more on the uncertainty, discusses over technology and theory. This article tries to describe the general grid architectures, and pays more attention to OGSA and the Semantic Grid.
Keywords:Grid computing the hourglass model OGSA the semantic grid
1引言
網(wǎng)格技術(shù)起源于20世紀90年代初又美國政府資助的分布式超級計算(Distributed Supercomputing)項目I-WAY.從1993年開(kāi)始,高性能計算技術(shù)和互連網(wǎng)技術(shù)進(jìn)一步融合,醞釀產(chǎn)生了繼因特網(wǎng)、Web之后的第三大技術(shù)浪潮。[1]
網(wǎng)格,過(guò)去,總把它想得像電力網(wǎng)一樣,“插上插頭”就能源源不斷地獲得計算能力?,F在,網(wǎng)格早已遠遠超出了計算的范疇。除了計算網(wǎng)格外,數據網(wǎng)格、儀器網(wǎng)格、虛擬現實(shí)網(wǎng)格、服務(wù)網(wǎng)格、信息網(wǎng)格、知識網(wǎng)格等,將網(wǎng)格應用擴展到方方面面。在1994年秋季舉辦的COMDEX大會(huì )上,比爾·蓋茨曾經(jīng)預言,2005年將實(shí)現“信息隨手可得”的目標[2]。事實(shí)證實(shí)了比爾·蓋茨的預言。而網(wǎng)格的應用該怎么進(jìn)行,以及如何進(jìn)入這個(gè)新興且積聚潛力的領(lǐng)域,特別是語(yǔ)義網(wǎng)格,正是本文的重點(diǎn)。
在第2部分,文中講述網(wǎng)格的基本概念,并對當前處于熱點(diǎn)的語(yǔ)義網(wǎng)格詳細介紹。第3部分,講述幾種目前常見(jiàn)的網(wǎng)格體系結構。第4部分則講述對現在和將來(lái)網(wǎng)格研究與應用都有重要影響的五層沙漏模型。第5部分,文中從設計原則、基本思想以及語(yǔ)義網(wǎng)格幾個(gè)方面著(zhù)重介紹網(wǎng)格體系結構。第6部分,總結全文。
2 網(wǎng)格
2.1 網(wǎng)格定義
網(wǎng)格計算研究的先導Ian Foster給網(wǎng)格下的定義是:網(wǎng)格計算是動(dòng)態(tài)多機構虛擬組織中的一個(gè)協(xié)調的共享資源和解決問(wèn)題的過(guò)程[3]。中科院計算所網(wǎng)格研究組給計算網(wǎng)格下的定義是:計算網(wǎng)格是一種分布式計算基礎設施(Infrastructure),用來(lái)實(shí)現在動(dòng)態(tài)的、跨組織域的虛擬組織(VO)內實(shí)現協(xié)同的資源共享和問(wèn)題求解[4]。關(guān)于網(wǎng)格計算與計算網(wǎng)格兩個(gè)完全不同的概念,各自的定義在本質(zhì)上都投影到VO,資源共享,協(xié)同性和異構性四個(gè)方面。
2.2 網(wǎng)格特征
計算網(wǎng)格的特征為一個(gè)異構性、動(dòng)態(tài)性的環(huán)境,有跨多管理域的多樣的和動(dòng)態(tài)的資源共享關(guān)系,滿(mǎn)足要求的QoS,與傳統的分布式和并行系統的區別:松散耦合、異構和動(dòng)態(tài)的環(huán)境,跨多個(gè)管理域[4]。
2.3 語(yǔ)義網(wǎng)格
這里提到語(yǔ)義網(wǎng)格,是因為語(yǔ)義網(wǎng)格是當前研究的一個(gè)熱點(diǎn),同時(shí)本人對這方面很感興趣。首先要區分一下語(yǔ)義網(wǎng)(semantic web)與語(yǔ)義網(wǎng)格(semantic grid).
語(yǔ)義web,是當前web的一種擴展,其中信息有很好的語(yǔ)義定義,人與電腦能更好的合作。[5]基本思想一是想完成這樣的夢(mèng)想:實(shí)現web內容的自動(dòng)化處理,這樣在分布式環(huán)境下,人和電腦也可以共享、處理web數據[6]。簡(jiǎn)單地說(shuō),語(yǔ)義web,是一種智能網(wǎng)絡(luò ),它不但能夠理解人類(lèi)的語(yǔ)言,還可以使人與電腦的交流跟人與人之間的交流一樣輕松。語(yǔ)義網(wǎng)能使機器理解含語(yǔ)義的文檔和數據。也就是說(shuō),語(yǔ)義web不但可以理解詞語(yǔ)與概念,而且還可以理解它們之間的邏輯關(guān)系。
將語(yǔ)義Web應用于網(wǎng)格環(huán)境,就形成了語(yǔ)義網(wǎng)格。語(yǔ)義網(wǎng)格小組對語(yǔ)義網(wǎng)格進(jìn)行了定義:語(yǔ)義網(wǎng)格就是“對當前網(wǎng)格的一個(gè)擴展,其中對信息和服務(wù)進(jìn)行了很好的定義,可以更好地讓計算機和人們協(xié)同工作”。實(shí)際上,語(yǔ)義網(wǎng)格通常都被看作是這樣一種結果:將網(wǎng)格和語(yǔ)義Web技術(shù)組合在一起,以便提高集成和數據計算的能力。語(yǔ)義網(wǎng)格實(shí)際上有兩種用途:用來(lái)發(fā)現處理數據的可用資源和對數據進(jìn)行集成[7]。
可見(jiàn),語(yǔ)義web與語(yǔ)義網(wǎng)格,重要的區別是,它們各自的應用環(huán)境。”語(yǔ)義網(wǎng)格:未來(lái)電子科學(xué)的基礎設施”一文指出:電子科學(xué)提供極有希望的前景,電腦與通信技術(shù)可以支持和增強科學(xué)研究過(guò)程。通過(guò)它科學(xué)家們以一種更有效的方式產(chǎn)生、分析、共享和討論他們的見(jiàn)識、實(shí)驗以及結果。潛在的提供這些設施的計算機基礎設施也就是當前提到的網(wǎng)格。[8]
3常見(jiàn)的幾種網(wǎng)格體系結構
1998年以來(lái),國內外對網(wǎng)格體系結構進(jìn)行了深入的研究,取得了一些成果[1]。一般認為,網(wǎng)格體系結構是關(guān)于如何建造網(wǎng)格的技術(shù),包括對網(wǎng)格基本組成部分和各部分功能的定義及描述、網(wǎng)格各部分相互關(guān)系與集成方法的規定、網(wǎng)格有效運行機制的刻畫(huà)。
常見(jiàn)的網(wǎng)格體系結構有4種:抽象層次結構、積木塊結構、概念空間結構和混合模式結構。
3.1 抽象層次結構
在抽象層次結構中,最具代表性的是Ian Foster等人在1998年提出的五層沙漏結構模型。該結構是以”協(xié)議”為中心的,強調協(xié)議在網(wǎng)格資源共享和互操作中的地位。
3.2 積木塊結構
積木塊結構實(shí)際上是一種組件結構,它強調的是計算網(wǎng)格中不現的功能相對獨立,又相互聯(lián)系的關(guān)系。在積木式網(wǎng)格系統中,整個(gè)系統的各個(gè)部件采用積木式模塊方式構建,具有很強的伸縮性,這也是作為模塊結構的共同特點(diǎn)。
3.3 概念空間結構
計算網(wǎng)格存在著(zhù)一系列的概念,如元數據、目錄、資源、協(xié)議、實(shí)體和對象等,這些概念構成 了計算 網(wǎng)格的概念空間,根據這些概念之間的關(guān)系 形成 的網(wǎng)格體系結構,稱(chēng)為空間結構。與上面兩種體系結構相比,概念空間體系結構的層次特征不夠清晰,它強調的是各部分在概念上的關(guān)聯(lián)。代理技術(shù)和面向對象技術(shù)是實(shí)現概念關(guān)聯(lián)的主要方法。
3.4 混合模式結構
模式結構就是以上各種結構的有機組合。開(kāi)放網(wǎng)格服務(wù)結構(OGSA)是種具有代表性的結構。這是在以IBM為代表的工業(yè)界的影響下,基于五層沙漏模型,在考慮到Web技術(shù)的發(fā)展與影響后,結合Web Services而提出的,是目前廣泛結合和支持的一種混合體系結構。
4 五層沙漏模型
五層沙漏結構的主要特點(diǎn)是結構簡(jiǎn)單、層次清楚。它提供一些核心服務(wù)為基礎用來(lái)構建高層的、特定領(lǐng)域的應用服務(wù)。
五層沙漏體系結構是以協(xié)議為中心的協(xié)議結構,自下而上分別為:構造層、連接層、資源層、匯集層和應用層。上層協(xié)議可調用下層協(xié)議的服務(wù)。網(wǎng)格內的全局應用都通過(guò)協(xié)議提供的服務(wù)來(lái)調用操作系統。該體系結構的各層功能定義如下:
第一層為構造層(Fabric):該層組件實(shí)現了基于底層特定資源的高層共享操作。它的功能是向上提供網(wǎng)格中可供共享的資源,它們是物理或邏輯實(shí)體,常用的資源包括處理能力、存儲系統、目錄、網(wǎng)格資源、分布式文件系統、分布式計算機池、計算機集群等。Toolkit中相應組件負責監測可用的軟硬件資源的特性、當前負荷、狀態(tài)等信息,并將其打包供上層協(xié)議調用。
第二層為連接層(Connectivity):該層定義了網(wǎng)格中網(wǎng)絡(luò )處理的核心通信與認證協(xié)議。通信協(xié)議使構造層資源間的數據交換成為可能。認證協(xié)議基于通信服務(wù)提供了確認用戶(hù)和資源身份的安全機制。在Toolkit中,相應組件采用基于公鑰的網(wǎng)格安全基礎協(xié)議(GSI)。在此協(xié)議中提供一次登錄、委托授權、局域安全方案整合、基于用戶(hù)的信任關(guān)系等功能。資源間的數據交換通過(guò)傳輸、路由及名字解析實(shí)現。
第三層為資源層(Resource):該層建立在連接層的通信和認證協(xié)議之上,定義了一些關(guān)于安全協(xié)商、使用共享功能計費、監控等方面的協(xié)議。它的作用是對單個(gè)資源實(shí)施控制,與可用資源進(jìn)行安全握手、對資源做初始化、監測資源運行狀況、統計與付費等有關(guān)的資源使用數據。在Toolkit中有一系列組件用來(lái)實(shí)現資源注冊、資源分配和資源監視。
第四層為匯聚層(Collective):這層的作用是將資源層提交的受控資源匯聚在一起,供虛擬組織的應用程序共享、調用。為了對來(lái)自應用的共享進(jìn)行管理和控制,匯聚層提供目錄服務(wù)、資源分配、日程安排、資源代理、資源監測診斷、網(wǎng)格啟動(dòng)、負荷控制、賬戶(hù)管理等多種功能。
第五層為應用層(Applications):這層是網(wǎng)格用戶(hù)的應用程序。應用程序通過(guò)各層的API調用相應的服務(wù),再通過(guò)服務(wù)調用網(wǎng)格上的資源來(lái)完成任務(wù)。應用程序的開(kāi)發(fā)涉及大量庫函數,為便于網(wǎng)格應用程序的開(kāi)發(fā),需要構建支持網(wǎng)格計算的庫函數。
如圖4.1 五層沙漏結構與internet協(xié)議的對比
隨著(zhù)網(wǎng)格計算研究的深入,人們越來(lái)越發(fā)現網(wǎng)格體系結構的重要。網(wǎng)格體系結構是關(guān)于如何建造網(wǎng)格的技術(shù),包括對網(wǎng)格基本組成部分和各部分功能的定義和描述,網(wǎng)格各部分相互關(guān)系與集成方法的規定,網(wǎng)格有效運行機制的刻畫(huà)。顯然,網(wǎng)格體系結構是網(wǎng)格的骨架和靈魂,是網(wǎng)格最核心的技術(shù),只有建立合理的網(wǎng)格體系結構,才能夠設計和建造好網(wǎng)格,才能夠使網(wǎng)格有效地發(fā)揮作用。
5 OGSA詳解
5.1 設計原則與思想
OGSA最突出的思想就是以“服務(wù)”為中心。在OGSA框架中,將一切都抽象為服務(wù),包括計算機、程序、數據、儀器設備等。這種觀(guān)念,有利于通過(guò)統一的標準接口來(lái)管理和使用網(wǎng)格。Web Service[9]提供了一種基于服務(wù)的框架結構,但是,Web Service 面對的一般都是永久服務(wù),而在網(wǎng)格應用環(huán)境中,大量的是臨時(shí)性的短暫服務(wù),比如一個(gè)計算任務(wù)的執行等??紤]到網(wǎng)格環(huán)境的具體特點(diǎn),OGSA 在原來(lái)Web Service 服務(wù)概念的基礎上,提出了“網(wǎng)格服務(wù)(Grid Service)”的概念,用于解決服務(wù)發(fā)現、動(dòng)態(tài)服務(wù)創(chuàng )建、服務(wù)生命周期管理等與臨時(shí)服務(wù)有關(guān)的問(wèn)題?;诰W(wǎng)格服務(wù)的概念,OGSA 將整個(gè)網(wǎng)格看作是“網(wǎng)格服務(wù)”的集合,但是這個(gè)集合不是一成不變的,是可以擴展的,這反映了網(wǎng)格的動(dòng)態(tài)特性。網(wǎng)格服務(wù)通過(guò)定義接口來(lái)完成不同的功能,服務(wù)數據是關(guān)于網(wǎng)格服務(wù)實(shí)例的信息,因此網(wǎng)格服務(wù)可以簡(jiǎn)單地表示為“網(wǎng)格服務(wù)=接口/行為+服務(wù)數據”[1]。圖5.1是對網(wǎng)格服務(wù)的簡(jiǎn)單描述。在目前OGSA的定義中,只有GridService接口是必需的,而其它的接口比如Notification Source、Notification Sink、Registry、HandleMap等都是可選的。
圖5.1 OGSA的網(wǎng)格服務(wù)示意圖
在目前,網(wǎng)格服務(wù)提供的接口還比較有限,如表格5.1所示,OGSA 還在不斷的完善過(guò)程之中,下一步將考慮擴充管理、安全等等方面的內容。
在OGSA 中,可以基于簡(jiǎn)單的基本的服務(wù),形成更復雜、更高級、更抽象的服務(wù)。比如一個(gè)復雜的計算問(wèn)題所需要的服務(wù),包括網(wǎng)絡(luò )、存儲、數據查詢(xún)、計算資源等各方面的服務(wù),可以將這些基本的服務(wù)組織起來(lái),形成一個(gè)高級的抽象服務(wù),方便地為應用提供支持。圖5.2是網(wǎng)格服務(wù)組成關(guān)系的示意圖。一個(gè)高級的抽象服務(wù)可以由A、B、C 三個(gè)不同的服務(wù)組成,而A和C 又分別是由其它的更具體的服務(wù)組成的,D、E、F 共同完成A服務(wù)的功能,而G 和H 完成C 服務(wù)的功能。
以網(wǎng)格服務(wù)為中心的模型具有如下好處[10]:
(1) 由于網(wǎng)格環(huán)境中所有的組件都是虛擬化的(virtualized),因此,通過(guò)提供一組相對統一的核心接口,所有的網(wǎng)格服務(wù)都基于這些接口實(shí)現,就可以很容易地構造出具有層次結構的、更高級別的服務(wù),這些服務(wù)可以跨越不同的抽象層次,以一種統一的方式來(lái)看待。
(2)虛擬化也使得將多個(gè)邏輯資源實(shí)例映射到相同的物理資源上成為可能,在對服務(wù)進(jìn)行組合時(shí)不必考慮具體的實(shí)現,可以以底層資源組成為基礎,在虛擬組織(Virtual Organization)中進(jìn)行資源管理。通過(guò)網(wǎng)格服務(wù)的虛擬化,可以將通用的服務(wù)語(yǔ)義和行為,無(wú)縫地映射到本地平臺的基礎設施上。
圖5.2 OGSA的復雜服務(wù)構成示例
5.2 語(yǔ)義網(wǎng)格的體系結構
在最近的三年里,在思想上最重要的思想演化,至少在現在看來(lái)可能是網(wǎng)格基礎設施內的語(yǔ)義web作用正確評價(jià)。這已經(jīng)導致最初的三層”網(wǎng)格”結構的偏離[11].雖然這種模型很有價(jià)值,但它不能在網(wǎng)格基礎設施上得以實(shí)現。最后,我們相信最近的一種體系結構,稱(chēng)為Goble [12],更好地闡述了不同層之間的交互關(guān)系。
正如圖5.3所反映的事實(shí),在一定意義上,數字的,自動(dòng)的網(wǎng)格世界必須滿(mǎn)足用戶(hù)所在的物理的,交互的世界?,F今,在很多情況下,人們能通過(guò)一些設備實(shí)現這種交互:掌上電腦、可佩帶的電腦、顯示器,訪(fǎng)問(wèn)網(wǎng)格、或者虛擬現實(shí)。不論怎么說(shuō),網(wǎng)格與自然界,人類(lèi)之間的主要問(wèn)題,仍然存在。
圖5.3 語(yǔ)義網(wǎng)格體系結構
6 小結
網(wǎng)格計算是一個(gè)正在迅速發(fā)展的研究領(lǐng)域,網(wǎng)格體系結構可以說(shuō)是網(wǎng)格建設中的核心技術(shù)。不管是網(wǎng)格計算還是OGSA 還遠不成熟,因此需要隨著(zhù)研究的深入不斷發(fā)展。相信在大量基于OGSA的應用與開(kāi)發(fā)展開(kāi)后,OGSA會(huì )不斷得到完善和提高,這也會(huì )直接推動(dòng)網(wǎng)格計算的發(fā)展。
對語(yǔ)義網(wǎng)格來(lái)說(shuō),實(shí)現語(yǔ)義網(wǎng)格全景必然帶來(lái)一系列的研究挑戰[8]。以下10條,從最初的報告中修訂而來(lái),這些領(lǐng)域我們認為研究必須實(shí)現的,下面的排列沒(méi)有特別要求。自動(dòng)虛擬組織的形成與管理、服務(wù)協(xié)商與合同、數據安全、元數據與注解、內容處理與整理、知識技術(shù)、設計與分配、交互處理、協(xié)作和普算[8]。
7 感謝
該文的完成,特別感謝http://www.chinagrid.net的站長(cháng)劉鵬,他提供了許多網(wǎng)格方面的資源,另外感
參考文獻
[1] 桂小林, “網(wǎng)格技術(shù)導論”,第1版,北京郵電大學(xué)出版社,2005.3.1
[2] 劉鵬, “網(wǎng)格不僅僅是計算,對網(wǎng)格應用的分析”, http://www.chinagrid.net
[3] Ian Foster,Carl Kesselman,”網(wǎng)格計算”,英文版第2版,機械工業(yè)出版社,2005.5.4
[4] 中科院計算所網(wǎng)格小組,”數據網(wǎng)格簡(jiǎn)介”
[5] Berners-LeeT Hendler J.and Lassin O. ”The Semantic web”, Scientific American,May,2001
[6] Angelo Gaeta, Francesco Oriciuoli MoMA Srl, Matteo Gaeta ,”Enabling Technologies for future learning scenarios: The Semantic Grid for Human Learning”
[7] IBM開(kāi)發(fā)者網(wǎng)站
[8] David De Roure, Nicholas R.
[9] Web Services 工作組, http://www.w3.org/2002/ws/
[10] OGSA結構描述,http://www.gridforum.org/ogsi-wg/drafts/ogsa_draft2.9_
http://www.Globus.org/ogsa/
[11] K.G.Jeffery, ”Knowledge, Information and Data”, CLRC Information Technology Dept., Sep.1999
[12] C.Goble, D.De Roure, ”The Semantic grid: Myth busting and bridge Building”, present at 16th Eur.Couf.Artificial Intelligence (ECAI-2004),
聯(lián)系客服