對信息模型的研究和分析一直是衛生信息標準化研究的重要組成部分。發(fā)達國家早在上個(gè)世紀九十年代就對衛生信息模型進(jìn)行了系統化的研究,并且形成了一些在一定領(lǐng)域和范疇之內得到廣泛認可、經(jīng)歷了實(shí)踐檢驗并不斷完善的信息模型。
我們以美國公共衛生概念數據模型(PHCDM)為重點(diǎn),對國外一些主要的衛生信息模型進(jìn)行了分析與研究,并對這方面工作已有的研究成果和先進(jìn)經(jīng)驗進(jìn)行了總結和借鑒。
國際主要衛生信息模型基本框架
1.美國HL7的參考信息模型

在HL7的參考信息模型(Reference Information Model,RIM)中,主題域包括實(shí)體(Entity)、角色(Role)、角色鏈接(Role link)、參與(Participation)、動(dòng)作(Act)和動(dòng)作關(guān)(聯(lián))系(Act Relation-ship)。其中“動(dòng)作”(Act)是這個(gè)主題域的核心部分,也是RIM的靈魂。目前很多國家衛生信息模型都參照或以RIM為元模型,建立自己的模型,例如美國的PHCDM,加拿大的CHIM等等。
2.加拿大的衛生信息模型
加拿大衛生信息模型(Canadian Health Information Model, CHIM)較側重于管理和資源,把管理和資源作為重要的主題域單獨提取出來(lái)。加拿大衛生信息模型的主要實(shí)體包括: 人、管理、資源、環(huán)境和事件,模型主框架如圖2所示:

● 人: 衛生系統所關(guān)注的個(gè)人、群體,以及他們的特征。
● 環(huán)境: 某個(gè)特定場(chǎng)所一系列特征,包括地形地貌的、微生物的或人造的物理環(huán)境特征。
● 管理: 為了規范和約束人們行為所確立的具體準則。
● 資源: 指有價(jià)值的事物,例如包括人力資源、財務(wù)資源、設備資源等。
● 事件: 指已經(jīng)或正在發(fā)生的事件。
3.澳大利亞的國家衛生信息模型
澳大利亞自1989年出版了“衛生保健基本數據集”后,認識到編制數據字典時(shí),如果僅僅按照衛生保健字典來(lái)編制字典的話(huà),容易造成遺漏或雜亂無(wú)章的現象,于是就提出了通過(guò)研發(fā)信息模型來(lái)對衛生數據字典提供支持這一現實(shí)的迫切需求。澳大利亞國家衛生信息模型(National Health Information Model, NHIM)目前已經(jīng)發(fā)展到了第2版,其功能已經(jīng)遠遠超出了“組織字典”而成為國家衛生信息的基本架構,并且在澳大利亞的許多國家級大型項目中起著(zhù)結構性的支撐作用。圖3是澳大利亞國家衛生信息模型第2版的宏觀(guān)結構圖:

● 參與者狀態(tài): 衛生部門(mén)中的人或團體所扮演的角色,以及他們可觀(guān)察到并且能夠進(jìn)行定義和測量的特征。
● 狀態(tài)變化事件: 在衛生部門(mén)內或相關(guān)團體間發(fā)生的事情或事件,以及它們的特征。
● 環(huán)境因素: 管理的、物理的或社會(huì )的環(huán)境,指的是在生活中或衛生部門(mén)工作中所處的實(shí)際環(huán)境。
● 分類(lèi)體系: 能夠用于分類(lèi)、編碼或評價(jià)衛生因素、狀態(tài)或事件。它包括了值域、編碼體系和工作指標。
美國公共衛生概念模型
1.PHCDM的研究目標
美國的公共衛生概念數據模型(PHCDM)是為國家電子疾病監視系統(NEDSS)項目的啟動(dòng)而進(jìn)行研究和開(kāi)發(fā)的,它的總體目的是整理、歸檔公共衛生所需的信息資料,并作為NEDSS起步的一部分,促進(jìn)數據標準化的發(fā)展。其主要作用包括: (1)為組織數據標準和指南提供一個(gè)框架; (2)降低公共衛生信息系統的開(kāi)發(fā)強度; (3)通過(guò)一致性來(lái)增強數據共享; (4)滿(mǎn)足在國家標準框架中描述公共衛生數據的需求; (5)促進(jìn)CDC與政府和地方合作者間在公共衛生領(lǐng)域的協(xié)作。
2.PHCDM中提出的模型層級理論
PHCDM提出的信息模型層級結構,將信息模型劃分為主題域模型、類(lèi)關(guān)系模型、概念數據模型、邏輯數據模型、數據庫設計模型和物理數據庫模型,分別處于上、中、下三個(gè)層級。這幾種模型的定義與功能如下:
● 主題域模型(SAM): 主題域模型只包含了主題域和它們的關(guān)系,通常作為一個(gè)大型域(例如一個(gè)主要功能域)的模型。它可以被用于工程范圍內的高層次計劃和設計。
● 類(lèi)關(guān)系模型(CRM): 類(lèi)關(guān)系模型只包含主題域、類(lèi)和關(guān)系,通常描述一個(gè)有限的領(lǐng)域(例如單個(gè)項目領(lǐng)域)。它被用于項目層次的高層面分析與評估。
● 概念數據模型(CDM): 概念數據模型包含主題域、類(lèi)、屬性、數據類(lèi)型、關(guān)系和一個(gè)計劃項目領(lǐng)域(如公共衛生、財政、物資管理)的通常模型。它是由相對細節層面的分析組成,而且經(jīng)常是一個(gè)首先交付的項目。
● 邏輯數據模型(LDM): 包含主題域、規格化類(lèi)、極小屬性、關(guān)系和候選/主鍵。經(jīng)常作為項目領(lǐng)域中的企業(yè)詳細執行的內容。它表示了最詳細層次數據分析的完成和數據庫設計啟動(dòng)。
● 數據庫設計模型(DDM): 包括表空間、表、列、數據類(lèi)型和主/外鍵,通常表示一個(gè)計算機信息系統現存或者正在設計的數據庫。它表示了數據庫構建的開(kāi)始和數據庫設計的開(kāi)始。
● 物理數據庫模型(PDM): 包含生成表和索引所需的數據定義語(yǔ)言(DDL),還包括數據庫管理系統(DBMS)強迫的約束。它是一個(gè)計算機信息系統現存的或者計劃的數據庫處理規范,對應于數據庫設計和構建的最終步驟。
如果根據這六種模型的目標對象和細節描述水平從上到下排列,又根據它們規范說(shuō)明的嚴格精密程度從左向右排列,就可以得到如圖4所示的排列方式:

PHCDM是概念數據模型的一個(gè)特殊例子,其優(yōu)勢在于: (1)它可以獨立于技術(shù)之外被多部門(mén)使用; (2)避開(kāi)了通常在創(chuàng )建物理數據模型中諸如數據結構、主鍵和外鍵、字段規范等等經(jīng)常出現的許多技術(shù)細節,確保了對公共衛生重要概念的充分描述和記錄; (3)由于PHCDM使用了一個(gè)合理的、高層面抽象的方式來(lái)記錄公共衛生概念,所以擴展了模型的應用范圍,并使得對維護的需求降到最小。
3.PHCDM的開(kāi)發(fā)過(guò)程
PHCDM的開(kāi)發(fā)始于1999年5月,首先是構造一個(gè)高級數據模型用于描述PHCDM所包含的主題域。主題域數據模型是在對美國疾病控制中心(CDC)的電子疾病監測系統、HL7 RIM和其它有關(guān)衛生數據模型進(jìn)行分析的基礎之上發(fā)展起來(lái)的。
1999年6月,PHCDM的開(kāi)發(fā)者創(chuàng )建了該模型的第一個(gè)“類(lèi)”圖; 1999年7月,CDC流行病學(xué)家對類(lèi)圖進(jìn)行了評價(jià),在意見(jiàn)反饋基礎上對其進(jìn)行了修訂; 同年8月,屬性被增加到這個(gè)類(lèi)模型中; 1999年9月到10月初,CDC內部以及國家、地方相關(guān)部門(mén)的專(zhuān)家共同對類(lèi)模型進(jìn)行了研討和評價(jià),并基于此作出了通過(guò)以下方式繼續完善和增強該數據模型的決定: (1)開(kāi)發(fā)一個(gè)公共衛生程序模型,為數據模型提供語(yǔ)境和分類(lèi)范圍; (2)采用HL7 RIM表示相關(guān)衛生行為; (3)通過(guò)建立一個(gè)原型數據庫(基于CDC對疾病管理和監測系統子集的信息需求)的方法,來(lái)驗證這個(gè)數據模型的正確性。
2000年1月,有關(guān)模型的基本原理、目標的詳細描述和出版物得到公認。PHCDM是滿(mǎn)足NEDSS數據標準化目標啟動(dòng)的關(guān)鍵,其各種模型的活動(dòng)有著(zhù)多重目標,但主要強調應用其處理CDC及合作伙伴的數據標準化問(wèn)題。
4.PHCDM的主要內容
(1)主題域
主題域是一個(gè)聚合類(lèi)模型劃分出來(lái)的、具有一定意義的部分,是在允許范圍內用子集的方式把一個(gè)模型劃分為若干更容易理解的區塊。PHCDM中有四個(gè)主題域: 衛生相關(guān)活動(dòng)、位置場(chǎng)所、客體和參與者。
● 衛生相關(guān)活動(dòng)主題域: 包含健康服務(wù)、健康環(huán)境和影響健康行為的信息。一個(gè)衛生相關(guān)活動(dòng)可以是一個(gè)觀(guān)察、干預、治療安排/處置或者信息發(fā)布通告。
● 位置場(chǎng)所主題域: 包含與參與者、衛生相關(guān)活動(dòng)或者客體相關(guān)聯(lián)的地點(diǎn)信息??梢允且粋€(gè)郵政地址、一個(gè)通訊地址或者一個(gè)物理地址。
● 客體主題域: 包含與衛生相關(guān)活動(dòng)和參與者有關(guān)的物資、設備和產(chǎn)品信息。如食物、藥品以及與公共健康相關(guān)的物理實(shí)體和其他有形內容。
● 參與者主題域: 包含衛生相關(guān)活動(dòng)的參與對象信息。他可以是一個(gè)獨立的個(gè)人和非人生命有機體,或者一個(gè)正式或非正式組織。
(2)PHCDM的類(lèi)與關(guān)聯(lián)
類(lèi)可以是人、地點(diǎn)、物品、概念或者事件等能夠被采集的信息。
PHCDM種共包含有29個(gè)類(lèi),其中包含四個(gè)核心類(lèi)。這四個(gè)核心類(lèi)對應于四個(gè)主題域,其內容是衛生相關(guān)活動(dòng)、位置、客體和參與者,圖5是四個(gè)核心類(lèi)的示意圖:

PHCDM中的29個(gè)類(lèi)的信息都是互相關(guān)聯(lián)的,PHCDM使用了UML建模語(yǔ)言定義了三種類(lèi)關(guān)聯(lián)方式:
● 父/子類(lèi)關(guān)聯(lián)
在父/子類(lèi)關(guān)聯(lián)中,更普通、泛化的類(lèi)被指定為父類(lèi),可以有一個(gè)或多個(gè)具體、特化的子類(lèi)。父/子類(lèi)關(guān)聯(lián)在數據模型圖中用連接父類(lèi)和子類(lèi)的連線(xiàn)表示。線(xiàn)的箭頭指向父類(lèi)。圖6為PHCDM四個(gè)核心類(lèi)的父/子類(lèi)關(guān)聯(lián)示意圖:

● 關(guān)系關(guān)聯(lián)
關(guān)系關(guān)聯(lián)是一個(gè)特殊關(guān)系類(lèi)型,用以反映同一個(gè)核心類(lèi)或其子類(lèi)中某個(gè)實(shí)例與另一個(gè)實(shí)例之間的關(guān)系。圖7為表示關(guān)系關(guān)聯(lián)一個(gè)例子的模型圖,兩邊的長(cháng)方形代表關(guān)系類(lèi),通過(guò)一對關(guān)聯(lián)線(xiàn)連接關(guān)系類(lèi)(活動(dòng)關(guān)系)和與之類(lèi)相關(guān)的核心類(lèi)(衛生相關(guān)活動(dòng)):

上圖中,“活動(dòng)關(guān)系”中每一個(gè)實(shí)例與且只與一個(gè)“衛生相關(guān)活動(dòng)”關(guān)聯(lián),而每個(gè)“衛生相關(guān)活動(dòng)”可能與零個(gè)或更多的“活動(dòng)關(guān)系”關(guān)聯(lián)。
● 參與關(guān)聯(lián)
參與關(guān)聯(lián)是PHCDM中專(zhuān)用于描述核心類(lèi)之間相互關(guān)系的關(guān)聯(lián),每個(gè)核心類(lèi)與其他核心類(lèi)之間都有著(zhù)多對多的關(guān)系。參與關(guān)聯(lián)用參與類(lèi)來(lái)描述,PHCDM中有五個(gè)參與類(lèi): 個(gè)體參與、對象參與、參與者位置參與、材料責任和材料位置參與。
(3)屬性與數據類(lèi)型
屬性是特殊的數據條目,每個(gè)屬性都有其名稱(chēng)、描述和賦予的數據類(lèi)型: 名稱(chēng)表明了屬性含義; 描述包括了屬性的定義、示例以及相關(guān)的討論; 數據類(lèi)型是屬性值允許格式的說(shuō)明,它同時(shí)擴展了屬性的定義。
屬性和賦予它的數據類(lèi)型在數據模型圖中描述類(lèi)的長(cháng)方形框的下部分列出(圖8):

要說(shuō)明的是,一個(gè)父類(lèi)屬性必定被其子類(lèi)所繼承。在上述例子中,參與者父類(lèi)中的“參與者標識”屬性也同時(shí)是參與者個(gè)體子類(lèi)(以及所有參與者其他子類(lèi))的屬性。
屬性名稱(chēng)依照以下格式:
[Class Name][{qualifier name}]Attribute-Type Name
由括號中的Class Name表示屬性的簡(jiǎn)稱(chēng); 大括號、中括號中的Qualifier Name表示可以有0個(gè)、1個(gè)或者多個(gè)限定名; 每一個(gè)屬性都有一個(gè)“屬性-類(lèi)型名稱(chēng)(Attribute-Type Name)”,它提供了屬性傳送的數據類(lèi)型標識。用于PHCDM中的屬性-類(lèi)型名稱(chēng)有: 數量、代碼、日期、種類(lèi)、標識符、名稱(chēng)、數據、量、文本、時(shí)間范圍和值域。
在數據模型圖中,數據類(lèi)型采用屬性名稱(chēng)后面用冒號隔開(kāi)的數據類(lèi)型標識符描述,PHCDM中的數據類(lèi)型是以下三種形式之一: (1)屬性名: 數據類(lèi)型名; (2)屬性名: SET〈數據類(lèi)型名〉; (3)屬性名: IVL〈數據類(lèi)型名〉。PHCDM收錄的數據類(lèi)型來(lái)自于HL7定義的數據類(lèi)型集。
數據類(lèi)型名稱(chēng)前置“SET”并且被括在括號里,表明該屬性可以重復,也就是說(shuō)該屬性可以有一組含有一個(gè)或者更多的值。例如,參與者標識符屬性是一個(gè)集,這表明一個(gè)參與者類(lèi)中的單個(gè)實(shí)例可以有多個(gè)標識符。
數據類(lèi)型名稱(chēng)前置“IVL”,表明這個(gè)屬性描述了一個(gè)從低到高的值域區間。PHCDM中,一個(gè)數據類(lèi)型前置IVL就限定了間隔次數。例如,日期時(shí)間范圍屬性是一個(gè)間隔值域,其含義表示相關(guān)日期時(shí)間描述了一個(gè)從開(kāi)始到結束的范圍。
(計算機世界報 2006年10月16日 第40期 B21、B22)
聯(lián)系客服