欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
國外學(xué)者對商業(yè)智能的研究 CIO俱樂(lè )部
國外學(xué)者對商業(yè)智能的研究
2006-2-15 10:10:00
1、 Howard Dresner對商業(yè)智能的定義
商業(yè)智能(BusinessIntelligence,簡(jiǎn)稱(chēng)BI)的概念最早是Gartner Group的Howard
Dresner于1996年提出來(lái)的。當時(shí)將商業(yè)智能定義為一類(lèi)由數據倉庫(或數據集市)、查詢(xún)報表、數據分析、數據挖掘、數據備份和恢復等部分組成的、以幫助企業(yè)決策為目的技術(shù)及其應用。當時(shí)的預測說(shuō):到2000年,信息民主(注:指組織內信息共享的無(wú)差別性)將在具有前瞻性思維的企業(yè)中浮現。借助商業(yè)智能,員工、咨詢(xún)員、客戶(hù)、供應商以及公眾能夠有效地運用信息。其實(shí),商業(yè)智能所涉及的技術(shù)與應用,在Howard Dresner命名之前就有,起初被稱(chēng)為主管信息系統(EIS),在羽化成商業(yè)智能之前叫決策支持系統(DSS)。
2、 Eric Thomsen對OLAP及商業(yè)智能的論斷
Eric Thomsen是DSS Lab的首席科學(xué)家,他提出了基于決策支持系統的OLAP的設計和實(shí)現。OLAP是創(chuàng )建商業(yè)智能系統的重要技術(shù),其技術(shù)的應用非常廣泛。Eric Thomsen在其代表作《OLAP解決方案:創(chuàng )建多維信息系統(OLAP Solutions: Building Multidimensional Information Systems)》第二版中有關(guān)于一些相關(guān)概念的論述:數據倉庫(DW)/決策支持系統(DSS)/商業(yè)智能(BI)/聯(lián)機分析處理(OLAP)/基于分析的面向決策的處理(ABDOP)——數據倉庫(DW)的焦點(diǎn)還是十分有限的。決策支持這個(gè)術(shù)語(yǔ)是以最終用戶(hù)為中心的,在談到OLAP和數據倉庫時(shí)作為ABDOP的補充。從這以后,數據倉庫和決策支持的范圍有了很大的擴展,但是還沒(méi)有達到ABDOP的全部?jì)热?。商業(yè)智能也開(kāi)始流行起來(lái),也覆蓋了相同的范圍,不過(guò)一般來(lái)說(shuō),它更加關(guān)注于最終用戶(hù)信息獲取的問(wèn)題。經(jīng)??吹饺藗儗祿}庫和決策支持或者商業(yè)智能聯(lián)合起來(lái)指代所稱(chēng)的ABDOP的全部范圍,卻沒(méi)有真正給整個(gè)范圍起一個(gè)名字。
Eric Thomsen采用蘇格拉底啟發(fā)式方式講解和論述了決策的階段,從而闡述了商業(yè)智能(或其平行概念)的研究?jì)热莺头椒ǎ?div style="height:15px;">
認為,通過(guò)觀(guān)察如何證實(shí)一個(gè)被挑戰的決策是否正確,就可以很好地了解到指定決策究竟需要些什么信息。
決策的目標是什么?如果沒(méi)有目標,任何決策都是沒(méi)有差別的。在尋求最優(yōu)決策的過(guò)程中,可能用到的算法包括線(xiàn)性編程和蒙特卡洛模擬協(xié)助在各種選擇、外部因素、偶然事件中進(jìn)行決策思考的工具就是決策分析工具。
如何證明決策可以達到預定的目標?惟一能夠證實(shí)決策是正確的方法是顯示一些預測結果。進(jìn)行預測用到的工具包括了統計分析和數據挖掘。
預測又是從何而來(lái)?這時(shí)候需要一個(gè)推理的過(guò)程。預測是模式、關(guān)系、解釋的延伸。他們需要至少一個(gè)用來(lái)延伸的假設。所有的預測都需要兩個(gè)描述和一個(gè)假設。用于發(fā)現模式的算法包括回歸、決策樹(shù)、聚類(lèi)、關(guān)聯(lián)規則、神經(jīng)元網(wǎng)絡(luò ),用于發(fā)現模式的工具也是統計和數據挖掘。
如何捍衛描述?如果描述是不正確的,不管推理如何,預測都將是錯誤的。因此,在原始數據收集過(guò)程中應該采用最好的質(zhì)量控制方法。
派生數據是否正確?如果原始數據和推理邏輯都是正確的,預測還是錯誤的,問(wèn)題就出在派生數據上。派生數據包括了各種匯總、分配、差別、比率、排序和乘積,例如每周的產(chǎn)品銷(xiāo)售量、每天的入庫總額、產(chǎn)品的總成本、部門(mén)收入、管理費用、銷(xiāo)售產(chǎn)品的成本、市場(chǎng)份額、產(chǎn)量和利潤等。OLAP工具所關(guān)注的就是創(chuàng )建派生變量。
3、 Tom Soukup 和 Ian Davidson對商業(yè)智能和可視化數據挖掘的闡述
在《可視化數據挖掘:數據可視化和數據挖掘的技術(shù)與工具(Visual Data Mining : Techniques and Tools for Data Visualization and Mining)》中指出:
商業(yè)智能解決方案將業(yè)務(wù)數據轉換成明確的、基于事實(shí)的、能夠執行的信息,并且使得業(yè)務(wù)人員能夠發(fā)現客戶(hù)趨勢,創(chuàng )建客戶(hù)忠誠度,增強與供應商的關(guān)系,減少金融風(fēng)險,以及揭示新的銷(xiāo)售商機。商業(yè)智能的目標是了解變化的意義——從而理解甚至預見(jiàn)變化本身。它使你能夠訪(fǎng)問(wèn)當前的、可靠的和易消化的信息,并能夠從各個(gè)側面及不同的維度靈活地瀏覽信息和建立模型。商業(yè)智能方案回答的是“如果……怎么辦(What if …)”之類(lèi)的問(wèn)題,而不是“發(fā)生了什么?(What happened ?)”。簡(jiǎn)而言之,商業(yè)智能解決方案是提高和維持競爭優(yōu)勢的一條有效的條件。
數據可視化和數據挖掘是兩種技術(shù),它們常常被常用來(lái)創(chuàng )建和部署成功的商業(yè)智能解決方案。通過(guò)應用可視化和數據挖掘技術(shù),業(yè)務(wù)人員能夠充分地探索業(yè)務(wù)數據,從而發(fā)現潛在的、以前未知的趨勢、行為和異常。
提出了一套行之有效的創(chuàng )建數據可視化和執行可視化數據挖掘的方法,包括8個(gè)步驟:①驗證和規劃數據可視化與數據挖掘項目;②識別最重要的業(yè)務(wù)問(wèn)題;③選擇數據集;④轉換數據集;⑤驗證數據集;⑥選擇可視化或挖掘工具;⑦分析可視化或挖掘模型;⑧驗證和展示可視化或挖掘模型。
4、 Bill Inmon對數據倉庫的定義
數據倉庫之父Bill Inmon在1991年出版的“Building the Data Warehouse”一書(shū)中所提出的定義被廣泛接受——數據倉庫(Data Warehouse)是一個(gè)面向主題的(Subject Oriented)、集成的(Integrated)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用于支持管理決策(Decision Making Support)。
面向主題。操作型數據庫的數據組織面向事務(wù)處理任務(wù),各個(gè)業(yè)務(wù)系統之間各自分離,而數據倉庫中的數據是按照一定的主題域進(jìn)行組織的。
集成的。數據倉庫中的數據是在對原有分散的數據庫數據抽取、清理的基礎上經(jīng)過(guò)系統加工、匯總和整理得到的,必須消除源數據中的不一致性,以保證數據倉庫內的信息是關(guān)于整個(gè)企業(yè)的一致的全局信息。
相對穩定的。數據倉庫的數據主要供企業(yè)決策分析之用,所涉及的數據操作主要是數據查詢(xún),一旦某個(gè)數據進(jìn)入數據倉庫以后,一般情況下將被長(cháng)期保留,也就是數據倉庫中一般有大量的查詢(xún)操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
反映歷史變化。數據倉庫中的數據通常包含歷史信息,系統記錄了企業(yè)從過(guò)去某一時(shí)點(diǎn)(如開(kāi)始應用數據倉庫的時(shí)點(diǎn))到目前的各個(gè)階段的信息,通過(guò)這些信息,可以對企業(yè)的發(fā)展歷程和未來(lái)趨勢做出定量分析和預測。
企業(yè)數據倉庫的建設,是以現有企業(yè)業(yè)務(wù)系統和大量業(yè)務(wù)數據的積累為基礎。數據倉庫不是靜態(tài)的概念,只有把信息及時(shí)交給需要這些信息的使用者,供他們做出改善其業(yè)務(wù)經(jīng)營(yíng)的決策,信息才能發(fā)揮作用,信息才有意義。而把信息加以整理歸納和重組,并及時(shí)提供給相應的管理決策人員,是數據倉庫的根本任務(wù)。因此,從產(chǎn)業(yè)界的角度看,數據倉庫建設是一個(gè)工程,是一個(gè)過(guò)程。
5、 E.F. Codd對OLAP的貢獻
60 年代末,E.F. Codd 所提出的關(guān)系數據模型促進(jìn)了關(guān)系數據庫及聯(lián)機事務(wù)處理(OLTP )的發(fā)展。數據不再以文件方式同應用程序捆綁在一起,而是分離出來(lái),以關(guān)系表方式供大家共享。數據量從80年代的兆字節及千兆字節過(guò)渡到現在的兆兆字節和千兆兆字節,同時(shí)用戶(hù)的查詢(xún)需求也越來(lái)越復雜,涉及的己不僅是查詢(xún)或操縱一張關(guān)系表中的一條或幾條記錄,而且要對多張表中千萬(wàn)條記錄的數據進(jìn)行數據分析或信息綜合。關(guān)系數據庫系統已不能全部滿(mǎn)足這一要求。這兩類(lèi)應用― 操作型應用和分析型應用,特別是在性能上難以?xún)扇?,盡管為了提高性能,人們常常在關(guān)系數據庫中放寬了對冗余的限制,引入了統計及綜合數據,但這些統計綜合數據的應用邏輯卻是分散雜亂的,非系統化的,因此分析功能有限,不靈活,維護困難。在國外,不少軟件廠(chǎng)商采取了發(fā)展其前端產(chǎn)品來(lái)彌補RDBMS 支持的不足。它們通過(guò)專(zhuān)門(mén)的數據綜合引擎,輔之以更加直觀(guān)的數據訪(fǎng)問(wèn)界面。力圖統一分散的公共應用邏輯,在短時(shí)間內相應非數據處理專(zhuān)業(yè)人員的復雜查詢(xún)要求。1993年,E.F. Codd 將這類(lèi)技術(shù)定義為“OLAP ”。鑒于Codd 關(guān)系數據庫之父的影響。OLAP 的提出引起了很大反響,OLAP 作為一類(lèi)產(chǎn)品同OLAP 明顯區別開(kāi)來(lái)。
聯(lián)機分析處理專(zhuān)門(mén)設計用于支持復雜的分析操作,側重對決策人員和高層管理人員的決策支持,可以應分析人員要求快速、靈活地進(jìn)行大數據量的復雜查詢(xún)處理,并且以一種直觀(guān)易懂的形式將查詢(xún)結果提供決策人員,以便他們準確掌握企業(yè)(公司)的經(jīng)營(yíng)狀況,了解市場(chǎng)需求,制訂正確方案,增加效益。
6、 國外學(xué)者對數據挖掘的定義及其研究方法的概括
Gartner Group :“數據挖掘是通過(guò)仔細分析大量數據來(lái)揭示有意義的新的關(guān)系、模式和趨勢的過(guò)程。它使用模式認知技術(shù)、統計技術(shù)和數學(xué)技術(shù)。”
The META Group的Aaron Zornes :“數據挖掘是一個(gè)從大型數據庫中提取以前不知道的可操作性信息的知識挖掘過(guò)程。”
SAS研究所:“在大量相關(guān)數據基礎之上進(jìn)行數據探索和建立相關(guān)模型的先進(jìn)方法”。
Bhavani :“使用模式識別技術(shù)、統計和數學(xué)技術(shù),在大量的數據中發(fā)現有意義的新關(guān)系、模式和趨勢的過(guò)程”。
Hand et al :“數據挖掘就是在大型數據庫中尋找有意義、有價(jià)值信息的過(guò)程”。
Fayyad :數據挖掘是一個(gè)確定數據中有效的,新的,可能有用的并且最終能被理解的模式的重要過(guò)程。
Zekulin :數據挖掘是一個(gè)從大型數據庫中提取以前未知的,可理解的,可執行的信息并用它來(lái)進(jìn)行關(guān)鍵的商業(yè)決策的過(guò)程。
Ferruzza :數據挖掘是用在知識發(fā)現過(guò)程,來(lái)辯識存在于數據中的未知關(guān)系和模式的一些方法。
Jonn :數據挖掘是發(fā)現數據中有益模式的過(guò)程。
Parsay :數據挖掘是我們?yōu)槟切┪粗男畔⒛J蕉芯看笮蛿祿囊粋€(gè)決策支持過(guò)程。
數據挖掘的功能大致有兩種,預測檢驗功能和描述功能。數據挖掘的任務(wù)主要有4項:①概念描述,即對數據進(jìn)行濃縮,給出某類(lèi)對象內涵的緊湊表示。②發(fā)現關(guān)聯(lián)規則,通過(guò)分析給出兩個(gè)或多個(gè)變量間存在的相關(guān)性規律。③聚類(lèi),即簇聚同類(lèi)對象,使在抽象空間中屬于同一類(lèi)別的個(gè)體距離盡可能小,反之盡量大。④偏差檢測,尋找觀(guān)察結果與參照值間的差別,這些偏差往往包含很多潛在有意義的知識信息。
應用較普遍的數據挖掘與知識發(fā)現方法有:
遺傳算法。其基本原理是:類(lèi)比生物進(jìn)化過(guò)程,每一代同時(shí)存在許多不同的種群個(gè)體(染色體)。這些染色體的適應性以適應性函數f(x)表征,染色體的保留與淘汰取決于它們對環(huán)境的適應能力,優(yōu)勝劣汰。適應性函數f(x)的構成與目標函數密切相關(guān),往往是目標函數的變種。?遺傳算子主要有3種:選擇(復制)算子、交叉(重組)算子和變異(突變)算子。遺傳算法可起到產(chǎn)生優(yōu)良后代的作用,經(jīng)過(guò)若干代遺傳,將會(huì )得到滿(mǎn)足要求的后代(問(wèn)題的解)。
粗集方法。其基本原理是:將數據庫中的行元素看成對象,將列元素看成屬性。設R為等價(jià)關(guān)系,定義為不同對象在某個(gè)(或幾個(gè))屬性上取值相同。那些滿(mǎn)足等價(jià)關(guān)系的對象構成集合,稱(chēng)為該等價(jià)關(guān)系R的等價(jià)類(lèi)。設E為條件屬性上的等價(jià)類(lèi),設Y為決策屬性上的等價(jià)類(lèi),則E 和Y存在3種情況:Y包含E稱(chēng)為下近似;Y與E的交非空,稱(chēng)為上近似;Y與E的交為空,稱(chēng)為無(wú)關(guān)。對下近似建立確定性規則,對上近似建立不確定規則(含可信度),對無(wú)關(guān)情況則不存在規則。
決策樹(shù)方法。決策樹(shù)方法是以信息論原理為基礎,利用信息論中互信息(信息增益)尋找數據庫中具有最大信息量的字段,建立決策樹(shù)的一個(gè)結點(diǎn)。然后再根據字段的不同取值建立樹(shù)的分支,在每個(gè)分支集中重復建立樹(shù)的下層結點(diǎn)和分支。這種方法實(shí)際上是依循信息論原理對數據庫中存在的大量數據進(jìn)行信息量分析,在計算數據特征的互信息或信道容量的基礎上提取出反映類(lèi)別的重要特征。
神經(jīng)網(wǎng)絡(luò )方法。其原理是:模擬人腦的神經(jīng)元結構,以MP模型和HEBB學(xué)習規則建立起前饋式網(wǎng)絡(luò )、反饋式網(wǎng)絡(luò )和自組織網(wǎng)絡(luò )3大類(lèi)多種神經(jīng)網(wǎng)絡(luò )模型?;谏窠?jīng)網(wǎng)絡(luò )的數據挖掘工具對于非線(xiàn)性數據具有快速建模能力,其挖掘的基本過(guò)程是先將數據聚類(lèi),然后分類(lèi)計算權值,神經(jīng)網(wǎng)絡(luò )的知識體現在網(wǎng)絡(luò )連接的權值上。神經(jīng)網(wǎng)絡(luò )方法用于非線(xiàn)性數據和含噪聲的數據時(shí)具有更大的優(yōu)越性,比較適合于市場(chǎng)數據庫的分析和建模,通過(guò)對市場(chǎng)數據庫中行業(yè)數據的精密分析,為市場(chǎng)人員提供顧客、用戶(hù)、市場(chǎng)狀況和市場(chǎng)走勢等方面的分析結果。(KMCENTER)
(網(wǎng)頁(yè)編輯:秋月
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
數據倉庫學(xué)習筆記
從數據倉庫到商業(yè)智能
大數據時(shí)代的商業(yè)智能
什么是BI(商務(wù)智能)
詳解BI的功能架構和技術(shù)架構
什么是BI(1) [精典轉載]
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久