欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
數據挖掘之道
數據挖掘之道
作者:張立明    文章來(lái)源:本站原創(chuàng )    點(diǎn)擊數: 268    更新時(shí)間:2007-3-27

何時(shí)需要使用數據挖掘工具

    數據挖掘,簡(jiǎn)單說(shuō),就是從大量的數據中,抽取出潛在的、有價(jià)值的知識、模型或規則的過(guò)程。隨著(zhù)信息技術(shù)的迅速發(fā)展和企業(yè)信息化的深入,企業(yè)積累的數據越來(lái)越多。數據的背后應隱藏著(zhù)許多重要信息,企業(yè)自然希望能夠對其進(jìn)行更高層次的分析,以便更好地利用這些數據。數據庫系統可以高效地實(shí)現數據的錄入、修改、統計、查詢(xún)等功能,但無(wú)法發(fā)現數據中存在的關(guān)系和規則,無(wú)法根據現有的數據預測未來(lái)的發(fā)展趨勢,導致了“數據爆炸但知識貧乏”的現象。

    可以說(shuō),數據挖掘是企業(yè)數據積累的必然結果和自然需要。而各行各業(yè)日益加劇的市場(chǎng)競爭,進(jìn)一步加速了對數據挖掘的需求和數據挖掘技術(shù)的發(fā)展??蛻?hù)保持、客戶(hù)價(jià)值分析、客戶(hù)流失預測、客戶(hù)信用分析、交叉銷(xiāo)售等等,已經(jīng)不再是誘人的口號,而是已經(jīng)成功應用到電信、金融、零售、保險等行業(yè)。

    此外數據倉庫技術(shù)的發(fā)展和廣泛實(shí)施為有效的數據挖掘提供了可能。IDC的調研報告中,2003年數據倉庫將達到200億美元的市場(chǎng)規模。數據倉庫將海量復雜的客戶(hù)行為數據集中起來(lái),建立一個(gè)整合的、結構化的數據模型,在此基礎上對數據進(jìn)行標準化、抽象化、規范化分類(lèi)、分析,為企業(yè)管理層提供及時(shí)的決策信息,為企業(yè)業(yè)務(wù)部門(mén)提供有效的反饋數據?,F在,NCR、IBM、Oracle等等廠(chǎng)商都在數據倉庫領(lǐng)域有所建樹(shù),一些預見(jiàn)性的模型和解決方案已經(jīng)被建立起來(lái),數據倉庫已不僅僅是簡(jiǎn)單的數據存儲,而成為對客戶(hù)資料進(jìn)行分析、挖掘客戶(hù)潛力的基石。

    可以說(shuō),如果企業(yè)在發(fā)展中已經(jīng)積累了大量的數據,也希望從這些寶貴的信息財富中得到為企業(yè)降低成本、增加利潤、提高核心競爭能力效率的秘訣,那么,該是實(shí)施數據挖掘的時(shí)候了。當然首先建立企業(yè)數據倉庫是有效進(jìn)行數據挖掘的基礎。

    如何進(jìn)行數據挖掘工具的選擇

    數據挖掘和數據倉庫一樣是一個(gè)過(guò)程,只有將數據挖掘工具提供的技術(shù)和實(shí)施經(jīng)驗與企業(yè)的業(yè)務(wù)邏輯和需求緊密結合,并在實(shí)施過(guò)程中不斷磨合,才能夠取得成功。因此我們在選擇數據挖掘工具時(shí),要全面考慮多方因素,其中應著(zhù)重關(guān)注一下四點(diǎn):

    1. 數據挖掘工具與數據倉庫能夠緊密結合

    ●可以減少數據轉換的時(shí)間。

    盡管數據挖掘并不要求一定要在數據倉庫之上進(jìn)行,但數據挖掘的種種問(wèn)題將耗費巨大的時(shí)間和資源,如從不同的數據集市中進(jìn)行數據采集,數據清洗,數據變換等等。一旦需要建立新的模型,您將不得不再次重復這個(gè)過(guò)程。大約70%的數據挖掘過(guò)程將花費在數據準備階段。數據倉庫通過(guò)減少數據冗余和系統管理使得數據挖掘更可行,并使模型開(kāi)發(fā)人員可以更集中于對數據的分析。

    ●可以充分利用整個(gè)企業(yè)的數據和詳細數據。

    在數據倉庫內直接進(jìn)行的數據挖掘提供了集中式數據挖掘體系,可以對數據倉庫中所有數據進(jìn)行分析,包括了企業(yè)的詳細數據,這樣就能夠挖掘出更多、更合理的模式。

    ●可以充分利用數據倉庫的處理能力

    在數據倉庫內直接進(jìn)行的數據挖掘,開(kāi)發(fā)模型、測試模型和部署模型都能夠充分利用數據倉庫的處理能力,得到更好的性能;另外,多個(gè)數據挖掘項目可以也同時(shí)進(jìn)行。

    2. 數據挖掘的功能和方法

    數據挖掘過(guò)程一般包括數據抽樣、數據描述和預處理、數據變換、模型建立、模型評估和發(fā)布等步驟。數據挖掘工具應該能夠為每個(gè)步驟提供相應的功能集。

    數據挖掘工具必須提供常用的數據挖掘模式,如分類(lèi)模式、聚類(lèi)模式、回歸模式、關(guān)聯(lián)模式、序列模式等。

    數據挖掘工具還應該能夠方便地提供挖掘出的模型(例如能夠用SQL語(yǔ)句導出模型),從而在企業(yè)的應用中集成使用該模型。

    3. 數據挖掘工具的伸縮性

    數據挖掘工具的伸縮性主要考慮兩個(gè)方面,一是數據量(行)增大時(shí)的性能表現,二是當挖掘維度增加時(shí)的性能表現;如果兩種情況下挖掘時(shí)間呈線(xiàn)性增長(cháng),則可認為工具的伸縮性較好。

    一般而言,能夠緊密結合數據倉庫,充分利用數據倉庫處理能力的數據挖掘工具有更好的伸縮性。

    4. 數據挖掘工具的可視化

    數據挖掘工具是否能夠實(shí)現數據可視化、挖掘模型可視化、挖掘過(guò)程可視化,可視化程度、質(zhì)量和交互靈活性嚴重影響到數據挖掘系統的使用和解釋能力。

    當前主流的挖掘工具如SAS Enterprise Miner、IBM Intelligent Miner、Teradata Warehouse Miner、SPSS Clementine等都能夠提供常用的挖掘過(guò)程和挖掘模式。

    總之,每個(gè)企業(yè)必須結合自己的實(shí)際情況何需要,充分考慮廠(chǎng)商在數據倉庫領(lǐng)域的咨詢(xún)和實(shí)施經(jīng)驗,避免踏入僅僅“選擇工具”的陷阱,力求獲得一個(gè)完整的數據倉庫和數據挖掘解決方案,并和廠(chǎng)商一起完成這個(gè)復雜的、富有挑戰性、創(chuàng )造性并充滿(mǎn)樂(lè )趣的過(guò)程。惟其如此,才能夠將數據倉庫和數據挖掘真正融入企業(yè)日常的經(jīng)營(yíng)決策之中。

本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
合理選擇數據挖掘工具
九道門(mén)丨數據挖掘:技術(shù)與工具(上)
詳解BI的功能架構和技術(shù)架構
什么是大數據分析?大數據分析要學(xué)什么?
大數據分析[對規模巨大的數據進(jìn)行分析]
2020年領(lǐng)導最滿(mǎn)意的可視化工具!分分鐘做好數據報表,吊打python
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久