摘要:網格技術目前已成為e-business和e-science的研究熱點。網格體系結構是構建網格系統的基礎。本文在分析科學計算網格、數據網格、知識網格、WEB服務網格等多種網格體系結構的基礎上,給出網格體系結構研究的最新成果,并指出網格體系結構研究的熱點及有待解決的問題。
關鍵詞:網格 網格體系結構 網格協議
一、引言
網格[1]是一種元計算技術(Metacomputing)[5],它就是將物理上分布、系統異構的多種計算資源通過高速網絡連接起來,共同解決大型應用問題。網格體系結構主要是研究網格系統的基本功能結構及各功能實體間的接口關系。國外已有很多項目在進行網格研究,比較重要的有Globus[15]和Legion[16]以及近來投入商用的Web Service[12]等,它們都對網格體系結構的研究作出了巨大的貢獻。
網格在產生初期主要集中在高性能的科學計算及仿真領域,現在的網格計算不再局限于此,已出現了不同應用領域的網格,參見圖一所示。面向不同應用領域的網格系統,在功能體系上有不同的特征及要求,而網格體系結構則研究的是一般網格系統的通用功能體系及其相互關系,它是對各專用網格系統的抽象與概括。本文的主要目的是通過對科學計算網格、數據網格、知識網格及Web服務網格體系結構的分析,給出網格體系結構研究的最新研究成果,并指出它研究的主要問題及下一步的研究方向。
二、面向科學計算及仿真應用的網格體系結構
固名思義,面向科學計算及仿真應用網格的基本功能,就是利用網格技術將多種復雜的分布式的計算資源組織起來,形成一個分布式、松耦合的巨型計算系統,該計算系統的主要任務是完成超大規模的、復雜的仿真和計算任務,如中長期天氣預報、航空航天跨領域的安全仿真等等??茖W計算及仿真應用網格是目前研究最早成果最多的網格,它也是網格研究的起點,該網格的基本體系結構如圖二[14]所示。

圖一網格應用的分類
科學計算網格體系結構的基本特征是系統中雖然有數據,但主要問題或關鍵問題是組織、訪問和管理計算任務,這是因為科學計算問題一般都是計算密集型問題,其CPU的開銷是巨大的,因此,如何將一個大問題分解為并發的任務,并將這些任務分配到多個異構的計算系統中去,同時將這些并發的任務有機的組織起來,以盡量小的管理開銷達到完成一個共同計算任務的目的,則成為科學計算網格的中心任務。
從圖二可以看出,該網格體系結構大致可分為應用層、網格通用服務及本地資源層。從網格通用服務來看,它是靠建立一組通用服務完成與各本地資源的通信連接,并為上層應用提供訪問接口。在廣域范圍內的科學計算問題的核心是性能問題,在目前的技術條件下,影響科學計算網格性能的一個重因素是通信問題,因為各計算任務之間往往存在大量的數據交換,但是因目前的通信技術還難以滿足在這樣大的范圍內進行大吞吐量的數據交換,因此要盡可能減少因通信而帶來的性能下降。這就要求在任務管理和分配的過程中,要進行任務的優化,要盡量使計算和通信過程重疊,提高系統的并發程度,增加計算粒度,減少任務之間的耦合度或用冗余的計算減少通信開銷,或者在通信傳輸上采用一些新技術提高傳輸效率,如集結成組傳輸、數據壓縮、調整傳輸協議的某些參數或采用特殊協議等等。因此在應用過程中,應注意在計算精度與通信能力之間作出平衡。
從科學計算網格的體系結構可以看出,這類網格對通信服務及任務分解及調度提出較高的要求。
科學計算網格的實例是Cactus, Globus[15]是科學計算網格系統一個最著名的組件,它的概念、功能、組成及結構對現在網格的研究有著重要的影響。
對通用網格服務的研究是網格體系結構研究的重要內容,從圖二可以看出,通用網格服務包含很多方面,它們的功能及層次成不一樣。但它們的總體功能是完成網格資源的統一訪問,為上層應用提供統一的訪問接口(API或SDK),有的是為了統一異構資源的訪問接口,協調多個用戶同步訪問同一資源的問題;有的是完成多個資源的聚集管理,包括查找、分類等等

圖二 科學計算網格的體系結構
總體上講,科學計算網格至少需要具備三種基本功能:(1)任務管理,用戶通過該功能向網格提交任務、為任務指定所需資源、刪除任務并監測任務的運行狀態;(2)任務調度,用戶提交的任務由該功能按照任務的類型、所需資源、可用資源等情況安排運行日程和策略;(3)資源管理,確定并監測網格資源狀況,收集任務運行時的資源占用數據。
三、數據網格的體系結構
數據網格[14] 是以大規模數據的共享、存貯、傳輸及分析為基本特征。初期的數據網格項目就是為了管理高能物理試驗的海量數據而建立的,數據網格系統一般都有海量數據的聯

圖三數據網格的體系結構
機采集系統,如高能物理儀器,它可以以Pbytes/Sec量級產生數據;高速數據傳輸,根據不同的應用,數據傳輸速率從100M—2.5G不等;從地域上講,可跨世界多個國家和地區。海量數據的共享、訪問、控制、管理及傳輸是數據網格的核心問題。著名的數據網格有EU Data Grid和GriphyN等。數據網格的體系結構參見圖三[14]所示。
從圖三可以看出,數據網格體系結構中最明顯的特征是在網格通用服務層中增加或強化了一些數據庫或數據管理服務,如數據管理(Data Management)、元數據管理(Metadata Management)、對象-文件的映射(Object-File Mapping)、復制管理(Replication Management)、SQL數據庫服務(SQL Database Server)、復制目錄(Replica Catalog)等。
數據網格以海量數據的存貯、傳輸、共享及分析為基本任務,因此數據網格必須如下能力:分析任務的能力,主要完成海量數據的分析,并對分析結果進行可視化處理,以便用戶使用;隨時掌握網絡中資源的能力;執行任務程序的能力,可根據用戶需要執行分析程序;任意數據傳輸的能力,數據傳輸是數據網格基礎通信服務,它對通信能力的要求相當高,突發強;判定和保障服務質量的能力;從錯誤中恢復的能力等等。
數據網格的實例就是歐洲的數據網格(EU Data Grid),它主要為高能物理研究而建立的,還有其它諸多數據網格項目如下:Particle Physics Data Grid (US, DOE),GriPhyN(US, NSF),iVDGL (US, NSF),TeraGrid (US, NSF),European Data Grid (EU,EC),DataTAG(EU, EC), Japanese Grid Projects(APGrid,Japan)。數據網格是近來發展最快的項目。