欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
研究SOA中信息管理的不同方法
利用信息管理的強大功能來(lái)用于基于面向服務(wù)體系結構(Service-Oriented Architecture,SOA)的建模、構架、設計和實(shí)現。在本文的棧視圖中,展示了信息管理提供的各種服務(wù),并有每種服務(wù)的詳細描述。作者從元數據管理和元數據集成的重要性說(shuō)起,再轉到信息管理所提供服務(wù)的檢驗,然后是 SOA 案例學(xué)習。最后,作者將列出一些與所討論服務(wù)相關(guān)的工具。

  SOA 不僅僅是 Web 服務(wù)

  圖 1 展示了信息管理提供的服務(wù)分類(lèi)邏輯視圖,這些服務(wù)是基于以下方面進(jìn)行分類(lèi)的:

  安全性
  協(xié)作
  可用性
  可管理性
  信息消耗

  雖然沒(méi)有哪種單獨的產(chǎn)品能提供以上所有的服務(wù),但將這些服務(wù)合在一起就可以創(chuàng )建 SOA 的完整信息管理框架。特別值得注意的是,某些文章將元數據管理置于信息管理棧的底部,在本文中我們認為,元數據管理是滲入其他服務(wù)并與其他服務(wù)緊密聯(lián)系的。事實(shí)上,SOA 是元數據驅動(dòng)的構架。

  圖 1:SOA 中的信息管理

  元數據管理

  元數據、元模型以及元-元模型

  最常見(jiàn)的元數據定義是關(guān)于數據的數據——其實(shí)并不然。根據規范的不同,元數據所指的含義也將不同?;旧?,元數據是關(guān)于數據的結構(語(yǔ)法)和含義(語(yǔ)義)的信息。元數據結構化方法的例子有關(guān)系數據庫管理系統(RDBMS)目錄、Java 庫目錄和 XML DTD 和 schema。這些每個(gè)都定義了數據是如何表示和使用的。從語(yǔ)義的角度來(lái)說(shuō),元數據提供了數據的含義。例子包括用數據字典、注釋或本體論(ontology)來(lái)描述。

  此外,還有用于內容管理的實(shí)例和類(lèi)的元數據。實(shí)例元數據只是儲存在內容管理元數據儲存庫中的數據,并引用存儲在別處的對象,例如文檔、Web 頁(yè)面、音頻和視頻文件。分類(lèi)和索引中的條目也同樣被認為是實(shí)例元數據。類(lèi)元數據,從某種角度來(lái)說(shuō),和 RDBMS 目錄和 XML schema 意義相同,用來(lái)描述實(shí)例元數據的結構。

元模型(也稱(chēng)元-元數據)定義了元數據的結構和語(yǔ)義。標準元模型的例子包括 Unified Modeling Language(UML)和 Common Warehouse Meta-model(CWM)。元-元模型層由元-元數據的結構和語(yǔ)義描述組成。目前正試圖提供一種可以描述所有其他信息模型的通用語(yǔ)言。Meta Object Facility(MOF)是元-元模型的一個(gè)標準。

  圖 2:MOF 元數據構架

  對元數據的生產(chǎn)者來(lái)說(shuō),遵循元模型、元數據接口、元-元模型和查詢(xún)語(yǔ)言方面的標準是非常重要的。通過(guò)這些標準,才能實(shí)現最大限度的互操作性,并可以服務(wù)于更多的元數據消費者,例如數據倉庫、分析和建模工具。SOA 正是依靠這些標準來(lái)實(shí)現生產(chǎn)者和消費者之間的動(dòng)態(tài)匹配、監控 BPEL 流,以及增強對 IT 資源和業(yè)務(wù)流程的跟蹤能力。

  元數據管理注意事項

  當我們重新設計元數據管理時(shí),由于 XML 的普及,它顯然是元數據的缺省數據格式。對于單個(gè)供應商或是組織來(lái)說(shuō),通常首選是集中方式,用來(lái)實(shí)現元數據資產(chǎn)的重用,并減少開(kāi)發(fā)的工作量,避免出現混亂。同樣,標準就是這個(gè)首選的方法。例如,IBM® 使用開(kāi)放源代碼的 Eclipse Modeling Framework(EMF)作為通用的元數據集成技術(shù)。EMF 為工具和運行時(shí)提供了元數據集成。因此,在 EMF 基礎上開(kāi)發(fā)的所有軟件都可以共享其它應用程序的通用方法。在理想的環(huán)境中(在短期內實(shí)現可能比較困難),元數據儲存庫可以?xún)Υ嫠械脑獢祿嫾?。服?wù)由信息管理體構,例如在需要時(shí),可以調用信息管理提供的服務(wù)(比如 SSO、ETL、聯(lián)合、質(zhì)量、搜索、版本控制和工作流)以獲取數據、內容和元數據管理。

  對于 XML 儲存庫而言,有兩種常用的用來(lái)儲存 XML 元數據的儲存機制。分別為 RDBM 和固有的 XML 儲存庫。每種儲存機制都有優(yōu)缺點(diǎn)。起決定作用的因素包括性能、靈活性、帶寬、互操作性、用戶(hù)定義數據類(lèi)型的支持以及數據質(zhì)量的保證等。

  無(wú)論對于供應商、企業(yè)或是行業(yè)級別而言,在進(jìn)行元數據管理時(shí),聯(lián)合的方法都是更加實(shí)用的。虛擬的元數據儲存庫允許應用程序通過(guò)單個(gè) API 訪(fǎng)問(wèn)并聚集不同種類(lèi)的元數據源。物理元數據構件可以被儲存在其初始的位置,也可以通過(guò) ETL/replication/cache 方法來(lái)改進(jìn)性能和元數據安置。在不同元數據源之間進(jìn)行自動(dòng)發(fā)現、映射和轉換對改進(jìn)元數據的可管理性都是非常重要。

數據、內容和元數據管理之間的關(guān)系

  一方面,元數據使程序間可以互相對話(huà)(實(shí)際上,供應商可調用它的元數據儲存庫 SuperGlue)。另一方面,元數據管理的需求與數據和內容管理是十分類(lèi)似的。元數據管理需要提供關(guān)于安全性、協(xié)作、 QoS 和可管理性的相同的服務(wù)類(lèi)型。元數據管理還要將 SSO、ETL、聯(lián)合、質(zhì)量、搜索、版本控制、工作流和儲存持久性結合在一起。元數據管理在自動(dòng)操作和編制(orchestration)方面的需求比數據和內容管理更多,因為元數據所服務(wù)的對象主要是計算機程序。

  不管怎樣,資產(chǎn)重用和服務(wù)編制可以通過(guò)在基于 SOA 且架構完善的信息管理基礎上構建元數據管理來(lái)實(shí)現。這就證明了將信息管理重新設計為基于 SOA 的可重用構件的重要性。

  元數據集成的難題

  前面已經(jīng)說(shuō)過(guò),集成元數據比集成數據和內容更加復雜。許多因素都增加了元數據集成的難度。這些因素包括:

  元數據無(wú)處不在,且在許多情況下對用戶(hù)是不可見(jiàn)的。
  許多產(chǎn)品中的元數據和元模型都有其專(zhuān)有格式,特別是內容管理。
  在內容管理中,向內容中添加元數據。許多內容都缺乏元數據來(lái)進(jìn)行集成和搜索。
  元數據集成相對數據和內容集成來(lái)說(shuō),需要更高級別的自動(dòng)化和編制。這就依次需要更高級別的自動(dòng)發(fā)現、轉換、映射和語(yǔ)義理解。
  為了避免失去當前客戶(hù),供應商還可以選擇保持客戶(hù)的專(zhuān)有元數據格式。
  轉換到元數據標準(例如 MOF)需要時(shí)間和工作量。

  元數據集成的業(yè)務(wù)價(jià)值

  SOA 在很大程度上是元數據驅動(dòng)的構架。要理解元數據集成的高級別業(yè)務(wù)價(jià)值,讓我們先進(jìn)行全方位的概覽。圖 3 闡明了隨需應變業(yè)務(wù)上下文中元數據集成的重要性?;谛畔藴?,元數據可以實(shí)現無(wú)縫信息交換。給出良好集成的元數據后,信息可以在由操作系統、編程語(yǔ)言、位置和數據格式組成的邊界之間自由流動(dòng)。因此元數據可以被認為是信息集成的“大腦”。此外,信息集成使得可以進(jìn)行業(yè)務(wù)集成,業(yè)務(wù)集成既可以是跨企業(yè)中各部門(mén)的,也可以是跨企業(yè)邊界的。它提供以下內容:

  通過(guò)數據倉庫或聯(lián)合的方式,提供單一且完整的客戶(hù)、伙伴、產(chǎn)品和業(yè)務(wù)視圖。
  通過(guò)使用分析服務(wù),使業(yè)務(wù)性能管理更加便利。
  通過(guò)廣泛的信息訪(fǎng)問(wèn)來(lái)增強業(yè)務(wù)應用程序。
  通過(guò)持續的信息服務(wù)實(shí)現業(yè)務(wù)流程轉換。

  最后,業(yè)務(wù)集成是隨需應變業(yè)務(wù)的基礎之一。通過(guò)使用 IT 技術(shù)服務(wù)于業(yè)務(wù)目標(而不是相反),使業(yè)務(wù)集成與之前的 Enterprise Application Integration(EAI)區別開(kāi)來(lái)。因此,說(shuō)元數據集成是隨需應變業(yè)務(wù)的“大腦”一點(diǎn)都不夸張。

  圖 3:元數據集成是隨需應變業(yè)務(wù)集成的大腦

高級元數據集成價(jià)值的例子包括:

  有助于來(lái)自不同源的數據/內容集成。
  縮短新應用程序的上市時(shí)間,并允許更快速的應用程序集成
  改善企業(yè)內部或企業(yè)之間的業(yè)務(wù)集成流程
  通過(guò)完整的集成信息分析,提供了全新的認識
  通過(guò)變更管理和預測分析,進(jìn)行結果分析

  數據和內容聯(lián)合:分散式方法

  聯(lián)合的概念是指將資源集看作單個(gè)資源來(lái)進(jìn)行查看和操作,且保持其自治(對當前的應用程序或系統影響極少或沒(méi)有影響)和完整性(不會(huì )破壞當前應用程序或系統中的數據或內容)。不用說(shuō),自治和完整性是聯(lián)合的兩個(gè)重要前提。

  自 20 世紀 90 年代后期,數據聯(lián)合已經(jīng)作為與集中方法截然不同的一種方法而出現了。在分散方法中,使用了數據市場(chǎng)(mart)和倉庫。數據聯(lián)合力圖將數據放在其原始位置上,并創(chuàng )建虛擬數據庫。類(lèi)似地,最近出現的內容聯(lián)合可以用來(lái)訪(fǎng)問(wèn)并聚集不同的內容源。這些分散的方法相比集中化方法而言,減少了數據和內容冗余、帶寬、儲存、實(shí)時(shí)同步以及額外的管理費用。對分布式信息源的實(shí)時(shí)訪(fǎng)問(wèn)同樣為業(yè)務(wù)智能帶來(lái)了新的性能,這應該遵循法定和管理需求。對于開(kāi)發(fā)人員來(lái)說(shuō),數據聯(lián)合減少了為不同的數據源編寫(xiě)和維護自定義 API 的需求,以及對高度專(zhuān)門(mén)技能的需求。

  對于數據聯(lián)合而言,最需要關(guān)注的就是其性能。要改進(jìn)性能,聯(lián)合需要經(jīng)常使用緩存、物理查詢(xún)表(MQT)以及分布式查詢(xún)優(yōu)化和執行。高速緩存和 MQT 在聯(lián)合的服務(wù)器上創(chuàng )建并管理表,這些服務(wù)器可以是目標聯(lián)合數據源的全部或是其中的一部分。作為一種 cutting-edge 工具,IBM WebSphere® Information Integrator 考慮了以下方面:

  源數據(例如基數或是索引)的標準統計
  數據服務(wù)器性能(例如連接特性和內置功能)
  數據服務(wù)器容量
  I/O 容量
  網(wǎng)速(請參閱參考資料部分的 IBM Redbook,“DB2II: Performance Monitoring, Tuning and Capacity Planning Guide”)

  ETL:集中方法

  提取-轉換-加載(Extract-transform-load,ETL)是用于數據集成的最古老的技術(shù)之一,且和數據儲存和業(yè)務(wù)智能緊密結合。該方法可以用于數據合并、遷移和傳播。ETL 工具從一個(gè)或是多個(gè)數據源中提取、轉換和加載數據至其它目標。ETL 曾經(jīng)一段時(shí)間是信息集成的主要方法且至今仍舊運用十分廣泛。與直接的提取和加載操作不同,轉換是最復雜的部分。因為在此過(guò)程中需要對數據進(jìn)行理解、轉換、聚集和計算。由于高費用、較慢的周轉周期以及數據源中不完整的信息集而使 ETL 和數據倉庫的優(yōu)勢大打折扣。

  集中式和分散式方法互補,將兩者結合在一起會(huì )產(chǎn)生很多的優(yōu)勢。

  集中式方法包含了以下一些方面:

  訪(fǎng)問(wèn)性能或可用性需求需要集中數據。
  當前需求要求時(shí)間點(diǎn)一致性,例如業(yè)務(wù)關(guān)閉。
  需要進(jìn)行復雜轉換,以實(shí)現數據的語(yǔ)義一致性。
  集中化方法通常用于生產(chǎn)應用程序、數據倉庫和操作數據存儲庫。
  集中化方法通常由 ETL 或是復制技術(shù)來(lái)管理。

  分散式方法包含了以下需要考慮的事項:

  源系統的訪(fǎng)問(wèn)性能和負載的提高可以降低整體實(shí)現的費用。
  當前需求需要數據的最新副本。
  數據安全性、許可限制或行業(yè)規則限制了數據傳輸。
  分散化方法可以結合復合格式數據,例如客戶(hù) ODS 與相關(guān)的契約文檔或是圖象相結合。
  查詢(xún)需要實(shí)時(shí)數據,例如股票報價(jià)、現有存貨目錄

數據復制和事件發(fā)布

  數據復制使數據的副本從一個(gè)位置移到另一個(gè)位置。目標位置可以是集中的位置,例如數據倉庫,也可以是網(wǎng)絡(luò )上另一個(gè)分布式位置。在網(wǎng)格環(huán)境中,復制和緩存服務(wù)用來(lái)創(chuàng )建 Placement Management Service 以滿(mǎn)足服務(wù)質(zhì)量 (QoS) 目標。根據訪(fǎng)問(wèn)模式和消費應用程序位置的不同,Placement Management Service 通過(guò)創(chuàng )建緩存或是副本來(lái)提高相應時(shí)間以及信息可用性。在 Web 應用程序環(huán)境中,當數據或是內容已經(jīng)準備好被發(fā)布用于公共消費時(shí),數據和內容復制通常用來(lái)將數據或內容從分段服務(wù)器(通常只是管理員使用的服務(wù)器)轉移到生產(chǎn)服務(wù)器。分段數據管理使組織能夠更好的控制信息流和信息的生命周期。例如,一個(gè) Web 站點(diǎn)支持多國語(yǔ)言。當一段數據或內容元素需要在網(wǎng)站上發(fā)布之前被翻譯,則首先需要將其傳給分段服務(wù)器。只有在被翻譯完并被管理員許可以后,才可以復制給生產(chǎn)服務(wù)器并進(jìn)行發(fā)布。

  復制可以與集中式或分散式方法共同使用。ETL 和數據復制間主要的區別是, ETL 通常在應用了數據過(guò)濾和轉換規則后,將數據移動(dòng)到集中位置,這要花費更長(cháng)的時(shí)間,并移動(dòng)更多的數據。數據復制移動(dòng)的數據集就小很多,可以更自動(dòng)化的方式移動(dòng)到集中的或是分散的位置。數據復制可以對數據進(jìn)行實(shí)時(shí)或是近實(shí)時(shí)訪(fǎng)問(wèn)。ETL 的主要目的是分析并監控數據,并生成業(yè)務(wù)智能。但數據復制的目標更多的與性能、數據管理和數據可用性相關(guān)。最后,ETL 和數據復制可以互補,換句話(huà)說(shuō),可以使用數據復制功能更快地將數據移動(dòng)到數據市場(chǎng)或是存儲庫,ETL 中的數據轉換功能可以提供數據復制領(lǐng)域更大的靈活性和更高的數據質(zhì)量。為了重用不同工具的邏輯,需要有易于調用且松耦合的信息服務(wù)。

  和 ETL 以及數據復制不同,事件發(fā)布并不清楚數據的去向以及如何使用數據。源表的變更將以 XML 格式或是其它數據格式發(fā)布到消息隊列。應用程序負責檢索已發(fā)布的事件并采取適當的操作,例如觸發(fā)業(yè)務(wù)流程或在將數據應用到目標數據源之前對數據進(jìn)行轉換。松耦合架構將服務(wù)提供者和消費者分離,并允許數據事件獨立于應用程序。

  邏輯數據和語(yǔ)義信息建模

  邏輯數據建模是軟件開(kāi)發(fā)的最佳實(shí)踐之一,也是當開(kāi)發(fā)組織在時(shí)間和預算壓力之下很容易被忽視的地方。雖然在內部開(kāi)發(fā)過(guò)程中經(jīng)常忽略邏輯數據建模,但組織經(jīng)常購買(mǎi)獲得 企業(yè)資源規劃(Enterprise Resource Planning,ERP)、客戶(hù)關(guān)系管理(Customer Relationship Management,CRM)或是其他類(lèi)型的包。結果是,許多版本的數據模型引用了組織內的同一個(gè)事物,且每個(gè)數據源都有自己的數據模型和元模型。例如,引用了客戶(hù)的不同的項,CRM 稱(chēng)其為 customer,記賬系統中稱(chēng)其為 client,而銷(xiāo)售系統中稱(chēng)之為 buyer,這種情況并不少見(jiàn)。教科書(shū)和理論家力圖從邏輯企業(yè)數據模型開(kāi)始,再轉至物理數據模型(例如實(shí)體關(guān)系圖)、代碼生成和開(kāi)發(fā),但是在實(shí)際中順序卻經(jīng)常顛倒過(guò)來(lái)。

  在實(shí)踐中,組織常分階段構建、購買(mǎi)或是獲取數據庫,且數據保持被隔離的狀態(tài)。有時(shí)這些組織認識到需要對數據進(jìn)行集成。那么接下來(lái)要怎樣實(shí)現呢?通常會(huì )鉆研大堆的文檔、成千上萬(wàn)的代碼行以及海量的數據,來(lái)發(fā)現其生產(chǎn)和消費的信息類(lèi)型,更不用說(shuō)這些組織要發(fā)現和記錄各種數據模型和業(yè)務(wù)流程之間的相互關(guān)系了。在這種情況下,自動(dòng)數據發(fā)現和概要工具可以加快這些流程,并減輕執行這些任務(wù)的復雜性。許多組織在最后將得到邏輯企業(yè)數據模型,這樣單獨的系統就可以被映射到公共邏輯模型上。轉換在一些案例中需要用到,例如貨幣間的轉換。最終,物理數據模型被映射到企業(yè)數據模型——即企業(yè)共享的公共邏輯數據模型。如果企業(yè)數據模型在一開(kāi)始就被設計為模型驅動(dòng)架構(Model Driven Architecture)的一部分,那么該模型就可以最大限度的發(fā)揮其優(yōu)勢。不過(guò),逆向的工程步驟也是非常有價(jià)值的。企業(yè)數據模型的主要優(yōu)勢在于:

  提供企業(yè)信息資產(chǎn)的概覽。
  增強使用 IT 技術(shù)來(lái)支持業(yè)務(wù)流程的實(shí)踐。
  減少企業(yè)信息集成(Enterprise Information Integration,EII)、企業(yè)應用程序集成(Enterprise Application Integration,EAI)以及數據存儲的費用和風(fēng)險。
  提供對數據、元數據和元模型的基于資產(chǎn)的重用。
  提高數據和元數據質(zhì)量。
  便于業(yè)務(wù)分析員、數據建模者、開(kāi)發(fā)人員和數據庫管理員之間的通信。

  語(yǔ)義信息建模(本體)不屬于邏輯數據建模,它對數據的語(yǔ)義(含義)和關(guān)系建模。它合并了多個(gè)知識領(lǐng)域的詞匯(術(shù)語(yǔ)和概念)。語(yǔ)義信息建??梢猿錾亟鉀Q許多難題,例如以下問(wèn)題:

  信息集成
  模型轉換
  解釋
  數據凈化
  搜索
  導航
  文本理解
  文檔準備
  語(yǔ)音理解
  問(wèn)答

  數據概要(Data profiling)

  數據概要是發(fā)現以下方面的流程:

  數據格式
  模式
  特性
  規則
  隱含關(guān)系

  數據概要同樣提供了很多的優(yōu)點(diǎn),包括:

  改善組織對數據的理解。
  有助于電子數據管理(Electronic Data Management,EDM)。
  便于數據映射和轉換。
  提高數據質(zhì)量。
  構建性能調整的基線(xiàn)。
  協(xié)助語(yǔ)義建模。

  數據概要旨在更好的理解信息并創(chuàng )建關(guān)于對象的更多元數據。

  數據、內容和元數據質(zhì)量

  數據質(zhì)量將影響企業(yè)信息管理策略的成功與否,企業(yè)信息管理策略決定了其業(yè)務(wù)集成策略的成敗。數據質(zhì)量問(wèn)題被認為是數據儲存項目失效的主要原因之一。低質(zhì)量的數據會(huì )導致誤傳的決策、無(wú)效的操作和錯失機遇,并且有時(shí)還會(huì )受到來(lái)自組織或市場(chǎng)的懲罰。 數據質(zhì)量并非華而不實(shí),它已經(jīng)成為業(yè)務(wù)的關(guān)鍵操作要素。

  數據質(zhì)量問(wèn)題的例子如下:

  丟失所需域的數據
  不一致的數據條目
  不正確或不準確的數據條目

  由于數據質(zhì)量工作固有的復雜性,一些組織選擇將這些工作外包給第三方服務(wù)提供商。我們將在本文后面部分的案例學(xué)習中看到。

  內容質(zhì)量經(jīng)常被部分忽視,這是因為評估內容質(zhì)量比評估數據質(zhì)量更困難。畢竟內容是非結構化的,且質(zhì)量標準更加主觀(guān)和隨意。內容質(zhì)量通常不包含在技術(shù)項目范圍之內。從組織的角度來(lái)說(shuō)內容質(zhì)量并未得到重視。但是,在 SOA 環(huán)境中,因為 SOA 不固定的特性而使內容質(zhì)量變得更加重要。如果錯誤數據或是質(zhì)量次的內容沒(méi)有及時(shí)發(fā)現,就會(huì )到處傳播。內容質(zhì)量標準由于內容類(lèi)型的不同而有所區別,但是評估內容質(zhì)量還是有一些共同的標準,如以下所示:

  關(guān)聯(lián)
  及時(shí)
  截止時(shí)間
  內容確認
  等級
  副本
  鏈接檢查

  由于對元數據管理能力需求的增長(cháng),元數據質(zhì)量最近受到更多的關(guān)注。改進(jìn)數據質(zhì)量的技術(shù),例如標準化、概要、審查、凈化、轉換和確認,都可用來(lái)改進(jìn)元數據質(zhì)量。

  強數據類(lèi)型是跨不同的編程語(yǔ)言和硬件確保 XML 數據值一致性的關(guān)鍵。但是,當前 XML 技術(shù)只允許單個(gè)文檔的 schema 確認,卻沒(méi)有一種有效的方法來(lái)跨不同的 schema 和數據源(比如在關(guān)系數據庫和 OO 數據類(lèi)型工具之間)驗證數據類(lèi)型(包括用戶(hù)定義的數據類(lèi)型)并實(shí)施語(yǔ)義強類(lèi)型。僅僅 XML 文檔類(lèi)型定義(DTD)或 schema 的標準化(許多行業(yè)試圖用這種標準化來(lái)作為該問(wèn)題的解決方案)是不夠的,因為當需要在多個(gè)行業(yè)之間集成數據時(shí)(這是隨需應變業(yè)務(wù)的一個(gè)基本需求。),XML DTD 或 schema 驗證、語(yǔ)義一致性和兼容性方面的問(wèn)題仍舊存在。

  搜索和查詢(xún)

  在企業(yè)搜索中,搜索分許多類(lèi)型:關(guān)鍵字、布爾值、范圍、多層面元數據(faceted metadata)、語(yǔ)義、自然語(yǔ)言和參數化。不論用哪種搜索,目的都是為了提供統一、相關(guān)并排序的結果集,從而可以快速且方便的訪(fǎng)問(wèn)信息。為便于搜索,可以使用索引(indexing,請不要與關(guān)系數據庫中的索引混淆)來(lái)索引非結構化內容(例如 Web 頁(yè)面、電子郵件數據庫或是文件系統)的關(guān)鍵字、概念和實(shí)例元數據,使這些內容可以被搜索和檢索。關(guān)系數據庫也可以被編入索引,以進(jìn)行更快和更靈活的搜索。

  雖然許多組織認識到集成結構化和非結構化信息的重要性,但目前的搜索結果仍舊互不相干。用戶(hù)想要的是指向潛在相關(guān)信息的一系列鏈接。用戶(hù)不得不對搜索結果慢慢的瀏覽檢驗,以找到所需的信息并與其最初的查詢(xún)目的聯(lián)系在一起。這基本上是手動(dòng)的流程。我們認為迫切需要研究使用搜索和查詢(xún)在數據和內容之間實(shí)現一項查詢(xún),一組結果集。

  數據庫通常都自帶搜索功能。最常見(jiàn)的搜索功能是使用 SQL 和 XQuery 之類(lèi)的查詢(xún)語(yǔ)言。用數據庫搜索來(lái)檢索結構化且嚴格匹配的數據十分管用,但這需要對查詢(xún)結構和數據模型十分熟悉和了解才行。數據庫搜索的用戶(hù)大都是開(kāi)發(fā)人員或是數據庫管理員。另外,數據庫搜索不適合于相關(guān)排序、模糊搜索和多關(guān)鍵字。因此,數據庫搜索的使用受到了很多限制。為實(shí)現高性能、靈活性以及相關(guān)排序等,一些搜索引擎與數據庫直接相連,從數據庫提取數據并生成索引。一個(gè)例子就是 IBM WebSphere OmniFind。

分析

  在先前 ETL 部分我們已經(jīng)闡明,數據倉庫將數據合并到中央位置以確保更好的進(jìn)行決策、跨部門(mén)報告和數據挖掘。傳統的分析包括報告、數據挖掘、儀表板(dashboard)、記分卡和業(yè)務(wù)性能管理。隨著(zhù)競爭日趨激烈,操作變得越來(lái)越復雜,規則也隨著(zhù)更加嚴格。組織需要實(shí)時(shí)訪(fǎng)問(wèn)不同的數據源來(lái)做以下改進(jìn):

  使用集成信息預測市場(chǎng)趨勢。
  更好的了解客戶(hù)。
  提高操作效率。
  確保遵循規則。
  獲取新知識。

  所有這些趨勢使得對信息管理分析能力的需求不斷增加。分析變得越來(lái)越重要。例如,如果銷(xiāo)售商知道現有客戶(hù)的合同、服務(wù)經(jīng)驗和其行業(yè)趨勢、其競爭者和客戶(hù),他(或她)就可以更好地為客戶(hù)定制專(zhuān)門(mén)的銷(xiāo)售建議。最近,分析經(jīng)常需要在不同的信息源間進(jìn)行信息集成。例如,要評估質(zhì)量,汽車(chē)制造商需要將事故報告(存在文檔管理系統內)、經(jīng)銷(xiāo)商的修理記錄(存在關(guān)系數據庫內)、司機的風(fēng)險因素以及環(huán)境因素(存在知識管理系統內)相關(guān)聯(lián)。在未來(lái),通過(guò)分析將能夠更加智能化的訪(fǎng)問(wèn)并關(guān)聯(lián)不同的信息源的信息,從而提供新的市場(chǎng)洞察和業(yè)務(wù)決策。

  相關(guān)服務(wù)

  以下服務(wù)被稱(chēng)為“相關(guān)”服務(wù),并不是因為它們對于信息管理而言不重要,而是因為他們對于業(yè)務(wù)流程和應用集成來(lái)說(shuō)十分常見(jiàn)。

  SSO、訪(fǎng)問(wèn)控制和審查

  單點(diǎn)登錄(SSO)到不同信息源、訪(fǎng)問(wèn)控制、審查對信息的查看和修改,這些共同構建了信息管理安全環(huán)境的基礎。SSO 對用戶(hù)提出您是誰(shuí)的問(wèn)題,訪(fǎng)問(wèn)控制則提出您可以做什么,審查隨時(shí)跟蹤您已完成的操作。SSO 的優(yōu)點(diǎn)很多:減少用戶(hù)受挫的可能、降低開(kāi)發(fā)工作量并提高效率。訪(fǎng)問(wèn)控制確保只有擁有正確權限的用戶(hù)才能訪(fǎng)問(wèn)數據和內容。一些業(yè)務(wù)需要非常復雜的訪(fǎng)問(wèn)權限管理,例如 Digital Rights Management。審查服務(wù)為數據和內容提供了額外的保障。查看、插入、修改和刪除信息操作都能被審查并被報告。隨著(zhù)對安全性和規則靈活性的需求不斷增長(cháng),SSO、訪(fǎng)問(wèn)控制和審查服務(wù)的結合為企業(yè)信息管理打下堅實(shí)的基礎。

  工作流和版本控制

  工作流和版本控制都設計為促進(jìn)團隊環(huán)境中的協(xié)作。在通過(guò)版本控制建立一致點(diǎn)時(shí),數據、內容和元數據管理、應用程序代碼開(kāi)發(fā)和流程都需要工作流,從而允許人們進(jìn)行協(xié)作,以便之后將這些一致點(diǎn)返回給版本控制。工作流將用戶(hù)、流程和信息鏈接在一個(gè)系統中。系統的每個(gè)部分——人、流程和信息——都是高度交互的,且它們之間的交互甚至更加動(dòng)態(tài)。例如,一家公司編寫(xiě)了一個(gè)程序使每個(gè)雇員都可以提交自己對任何主題的建議。根據建議類(lèi)別的不同(信息),這些建議將被不同的人發(fā)送、評審和處理(流程,人)。因此,需要一個(gè)高度健全且合適的工作流來(lái)處理不能預料的情況。一旦開(kāi)發(fā)了這樣的工作流服務(wù),不用的應用程序可以對其進(jìn)行調用,這些應用程序包括文檔管理、HR 系統或者知識管理。

  門(mén)戶(hù)

  業(yè)界分析家預測,結合了 Web 服務(wù)的企業(yè)門(mén)戶(hù)將未來(lái)的十二個(gè)月內實(shí)現。門(mén)戶(hù)集成了應用程序和信息,并通過(guò)統一的視圖將其呈現給最終用戶(hù)。由于 EII 提供了抽象層,開(kāi)發(fā)人員可以訪(fǎng)問(wèn)并匯集不同的信息源、維護代碼并實(shí)現性能和安全性需求,而無(wú)需編寫(xiě)自定義適配器。因此,應用程序開(kāi)發(fā)可以節省大量的時(shí)間、花費和技能需求,且門(mén)戶(hù)用戶(hù)可以輕松訪(fǎng)問(wèn)各種廣泛的信息。最重要的是,可以對端到端業(yè)務(wù)流程進(jìn)行輕松且快速的集成。

  案例學(xué)習:數據質(zhì)量服務(wù)實(shí)例

  信息管理棧中的企業(yè)搜索、數據質(zhì)量與驗證,以及分析等服務(wù)通常是外購的不錯選擇。SOA 下的信息管理框架確立了一個(gè)新的業(yè)務(wù)模型,該業(yè)務(wù)模型越來(lái)越受到使用者的歡迎。讓我們看一個(gè)案例學(xué)習,該案例通過(guò) SOA 提供了數據驗證服務(wù),這種服務(wù)也是一種數據質(zhì)量服務(wù)。

  為了防止出錯和欺詐行為,或是為了遵循相關(guān)法律和規定(比如 Sarbanes-Oxley),許多電子商務(wù)公司需要實(shí)時(shí)檢驗地址、電話(huà)號碼以及社會(huì )安全號碼等識別信息。由于數據質(zhì)量確認的復雜性,一些公司訂購了由第三方提供的數據驗證服務(wù),而不是開(kāi)發(fā)內部解決方案。一些公司提供數據驗證和質(zhì)量服務(wù),并提供網(wǎng)上的實(shí)時(shí)地址和電話(huà)號碼驗證。在客戶(hù)填寫(xiě)了電子商務(wù)應用程序并在線(xiàn)提交后,電子商務(wù)公司將客戶(hù)信息封裝至 XML 文檔并通過(guò) Web 服務(wù)、簡(jiǎn)單對象訪(fǎng)問(wèn)協(xié)議(Simple Object Access Protocol,SOAP)和 Web 服務(wù)描述語(yǔ)言(Services Description Language,WSDL)將其發(fā)送到數據驗證公司。數據驗證公司將在相同的客戶(hù)事務(wù)中,對數據進(jìn)行實(shí)時(shí)驗證。對于客戶(hù)而言,他們將獲得及時(shí)的反饋,并能夠糾正或取消事務(wù)。

  在過(guò)去,如果在流程中數據出錯,電子商務(wù)要在數天甚至數月以后才能收到不能投遞的地址或是電子郵件。同時(shí),客戶(hù)還不明白他們的帳戶(hù)出了什么問(wèn)題。使用 SOA 進(jìn)行數據驗證服務(wù),使電子商務(wù)公司從維護和更新數十億字節的數據庫信息的重擔中解脫出來(lái),這些數據庫信息包含數百萬(wàn)來(lái)自不同城市和地域的用戶(hù)姓名、電話(huà)號碼和有效地址。

  結束語(yǔ)

  作者闡述了信息管理提供的每個(gè)服務(wù),并特別關(guān)注元數據管理和集成。雖然服務(wù)的種類(lèi)有很多,但這些是至關(guān)重要的,如果您還記得下列價(jià)值取向,可以參閱信息管理的要點(diǎn):

  安全性
  協(xié)作
  服務(wù)質(zhì)量
  可管理性
  消費

  希望本文可以使您意識到信息管理的重要性和其涉及的廣泛領(lǐng)域。通過(guò)掌握單個(gè)部分和它們之間交互的知識,您將能更有效的利用信息管理的優(yōu)勢,以構建健全且均衡的 SOA。

本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
數據架構師工具包
淺談MES-14. 一些MES廠(chǎng)商MES有哪些特點(diǎn)和發(fā)展?
數據集成之數據聯(lián)邦(data federation)
實(shí)時(shí)數據集成
基于XML的知識管理系統
大數據時(shí)代下的數據集成(三)——主數據管理基礎概念
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久