鏈接|智慧城市領(lǐng)域435個(gè)政府委辦局2130家運營(yíng)商8626家系統集成商通訊錄
鏈接|2017第六期新型智慧城市評價(jià)高級研修班招生簡(jiǎn)章【惠民服務(wù)篇】(智慧小鎮、智慧城市PPP流程、網(wǎng)信安全、互聯(lián)網(wǎng)+政務(wù)服務(wù))
一、 數據應用存在的問(wèn)題
問(wèn)題
信息共享的效益難題
信息共享迷信導致了思維停滯
工具變成了目標必然導致效益喪失
數據整合理念需要認真反思
國內電子政務(wù)建設一直強調信息共享,十五年后還在強調信息共享,只能說(shuō)明信息共享建設始終缺乏成效,使我們不得不考慮是目標有誤還是路徑不對。電子政務(wù)建設的成績(jì)大都集中在政府業(yè)務(wù)處理自動(dòng)化方面而非信息共享,只有理清信息共享的效益難題,數據整合才能避免重蹈覆轍。
缺少質(zhì)疑精神使信息共享反省始終不到位,長(cháng)期過(guò)度的宣傳使人不敢對信息化常識有一點(diǎn)懷疑,信息共享已成為一種迷信,在信息資源稀缺時(shí)代強調信息共享尚有一定道理,但在全球信息爆炸之后還持同樣的看法就不合理了,只強調增加數據的信息共享只能使資料過(guò)剩愈加嚴重。對信息共享價(jià)值的迷信使思維停滯,任憑無(wú)效的信息共享蔓延。
信息共享效益不好的重要原因是把信息共享當成終極目標,而忘記共享效益才是目標,以為信息共享就是效益,其實(shí)信息共享只是工具,工具與效益是兩回事,真正有效益的信息共享只是少數,多數信息共享對政府工作并無(wú)幫助,效益也無(wú)法聚集,有效益的信息共享都是精心設計的結果。
信息共享的效益均來(lái)自最終目標實(shí)現產(chǎn)生的總效益,有效的信息共享應能降低最終目標實(shí)現成本、加快實(shí)現進(jìn)度、提升最終價(jià)值。只有對最終成果有貢獻的信息共享才是有效的,在信息化建設中稀缺的不再是資料而是最終效益目標,目標導向是提升效益之路。
一窩蜂的智慧城市建設最容易出現概念不清決心大,事前不想清楚為什么是粗放文化的通病,粗放文化使國內信息化建設缺乏效益。信息化使政府積累的數據資料越來(lái)越多,數據整合問(wèn)題已經(jīng)提上日程,但是對于什么是數據整合、數據整合的效益如何產(chǎn)生并沒(méi)有充分討論,粗放的數據整合與粗放的信息共享都不會(huì )產(chǎn)生效益,認真研究政府數據整合的理論與方法已是當務(wù)之急。
二、 數據來(lái)源、使用方式二維矩陣
電子政務(wù)信息共享出現的諸多問(wèn)題均來(lái)自粗放的概念思維,例如系統業(yè)務(wù)之間的數據共享與決策研究用的信息共享并沒(méi)有區分,用統一的信息共享交換平臺解決兩方面的問(wèn)題其結果是一個(gè)都做不好,建設大數據管理中心如果仍舊采用粗放的思維方式,不對數據來(lái)源與應用模式的細分只能亂上加亂。面對不斷增加的數據復雜性只靠決心大是不行的,方法必須科學(xué),精細分類(lèi)是降低復雜性的手段,對數據來(lái)源與使用方式分類(lèi)有助于問(wèn)題的清晰化。
政府工作常用的數據資源一種來(lái)自人工,另一種來(lái)自自動(dòng)化設備。人工填報的數據不論是統計調查還是業(yè)務(wù)記錄,都是人腦生產(chǎn)的數據,人工填報數據不可能很快也不能做到精準,人工數據都屬于小數據范圍,其優(yōu)點(diǎn)是收集容易處理簡(jiǎn)單。
自動(dòng)化設備可以是各種傳感器也可以是互聯(lián)網(wǎng),當然并不是說(shuō)數據只要經(jīng)過(guò)互聯(lián)網(wǎng)就是互聯(lián)網(wǎng)數據,而是指利用互聯(lián)網(wǎng)機制自動(dòng)收集的數據,自動(dòng)化數據也可稱(chēng)為電腦數據,電腦數據精準而客觀(guān)且數據生產(chǎn)的效率非常高,遠遠超過(guò)人工數據的規模,所以被稱(chēng)為大數據。小數據與大數據的區別不只是規模更是來(lái)源不同。
系統業(yè)務(wù)應用是業(yè)務(wù)流程對數據的使用,大量出現在政府系統化業(yè)務(wù)之中,如政府行政許可審批、辦理出入境手續、各種網(wǎng)上辦事等等,這些服務(wù)是精準地按照當事人相關(guān)的數據進(jìn)行操作,其結果是由制度與數據決定而與操作者無(wú)關(guān),系統應用只認數據,沒(méi)有信息概念。
專(zhuān)家應用是在信息層次上使用數據,要從數據中提取信息,與自己的知識經(jīng)驗相結合來(lái)進(jìn)行分析判斷,形成新的見(jiàn)解,這是人腦使用數據的模式,常見(jiàn)于政府的決策研究,決策使用信息而非數據,數據要抽象出信息才能應用。
將兩類(lèi)數據來(lái)源(人工數據、自動(dòng)化數據)與兩類(lèi)應用(系統業(yè)務(wù)模式、專(zhuān)家應用模式)組合起來(lái),即可得到四種數據的收集與使用狀況:
1. 數據操作業(yè)務(wù): 人工數據 ——系統業(yè)務(wù);
2. 搜索監管業(yè)務(wù): 自動(dòng)化數據——系統業(yè)務(wù);
3. 信息決策應用: 人工數據 ——專(zhuān)家應用;
4. 優(yōu)化改進(jìn)應用: 自動(dòng)化數據——專(zhuān)家應用。
數據整合的四種模式形成如下的2×2矩陣:
數據來(lái)源——數據使用矩陣圖
使用方式 數據來(lái)源 | 系統業(yè)務(wù): 數據精確使用 (系統、人工智能方式) | 專(zhuān)家應用: 信息模糊使用 (人腦分析使用方式) |
人工數據 (小數據) 業(yè)務(wù)數據、人工調查、個(gè)人填報等 | 1:數據操作業(yè)務(wù) 居民網(wǎng)上辦事、政府業(yè)務(wù)精細化管理,面向數據操作,提高基層操作效率 | 3:信息決策應用 數據的統計應用、可視化數據展示,獲取整體信息 用于決策研究等 |
自動(dòng)化數據 (大數據) 視頻、傳感器、互聯(lián)網(wǎng)數據等 | 2:搜索監測業(yè)務(wù) 信用系統、案件偵破、金融詐騙防范、反恐等業(yè)務(wù) 以及環(huán)境監測類(lèi)應用 | 4:優(yōu)化改進(jìn)應用 大數據分析、大數據挖掘、可視化展示,獲取專(zhuān)業(yè)信息用于工作優(yōu)化改進(jìn)等 |
數據操作業(yè)務(wù)特點(diǎn)
數據操作業(yè)務(wù)常見(jiàn)于政府的系統化業(yè)務(wù),為提高工作效率業(yè)務(wù)都設計成規范化操作系統,工作人員按標準化流程操作,系統運行結果與操作人無(wú)關(guān),是系統在使用數據而非操作人員使用。
政府大多數網(wǎng)上服務(wù)均屬此類(lèi)模式,發(fā)改委等十部委提出的“一號一窗一網(wǎng)”的服務(wù)方案所指的都是此類(lèi)業(yè)務(wù),業(yè)務(wù)使用的是與服務(wù)對象相關(guān)的數據,如辦理戶(hù)口、簽證等只使用與個(gè)人相關(guān)的數據,處理結果由數據及規則決定,操作者沒(méi)有自由量裁空間,其結果是按規范產(chǎn)生的,誰(shuí)操作都一樣。
(1)數據精準:這種業(yè)務(wù)完全是依據與當事人有關(guān)的數據操作,數據不準確就會(huì )出錯,保證數據的準確是第一位的。
(2)調用迅速:調用迅速是提高效率的關(guān)鍵,要能夠跨部門(mén)使用政府數據,減少用戶(hù)跑腿,不僅方便用戶(hù)、方便工作人員還能減少數據欺騙。
數據操作業(yè)務(wù)是政府基層服務(wù)的主要形式,其使用的數據是用戶(hù)填報數據與業(yè)務(wù)流程積累的數據,不同類(lèi)的業(yè)務(wù)數據是由不同的業(yè)務(wù)部門(mén)收集的,數據并沒(méi)有鏈接,不同部門(mén)的數據必然會(huì )存在不一致問(wèn)題,雖然數據都已入庫,但未經(jīng)磨合的跨部門(mén)調用是不可能通暢的,數據整合的任務(wù)就是要使之流暢化。不同部門(mén)業(yè)務(wù)數據進(jìn)行整合并不需要數據集中存儲,主要是提升按主題標識碼調用不同數據庫的速度,要統一各部門(mén)的主題標識碼,要能夠核對數據并及時(shí)更正錯誤,排除數據的相互矛盾,使業(yè)務(wù)數據跨部門(mén)查詢(xún)流暢化。
搜索監測業(yè)務(wù)的應用場(chǎng)景
搜索監測業(yè)務(wù)屬于大數據資源微觀(guān)應用業(yè)務(wù),常用于案件偵破、危險分子查詢(xún)、反恐、反欺詐等工作,其關(guān)注的焦點(diǎn)是個(gè)體信息,目的在于發(fā)現異常的個(gè)體行為而非普遍性規律。類(lèi)似于常見(jiàn)的“人肉搜索”。利用各種信息痕跡追蹤懷疑目標,也用于對環(huán)境的監管,發(fā)現超標信號進(jìn)行預警。
搜索監測型業(yè)務(wù)使用者主要是安全機構,如公安部門(mén)、金融保險部門(mén)、政府補貼欺詐防范部門(mén)(政府醫療費、困難補助每年都有大量騙費行為)、反恐反洗錢(qián)部門(mén)等,交通安全部門(mén)、環(huán)保部門(mén),也包括用戶(hù)信用服務(wù)機構。
搜索監測型業(yè)務(wù)使用的數據源包括記錄人們信息痕跡的大數據資源,如互聯(lián)網(wǎng)查詢(xún)記錄、移動(dòng)電話(huà)記錄、ETC車(chē)輛行動(dòng)記錄、視頻畫(huà)面、信用卡使用記錄等等,很多數據源涉及到個(gè)人隱私,使用必須謹慎,要依法辦事。
對于重要的社會(huì )安全治理,政府會(huì )建設城市感知網(wǎng)收集數據進(jìn)行安全監管,例如人流危險監管、公共設施安全監管、環(huán)境保護監管、食品、藥品監管等,這些數據的整合主要措施是壓縮內容、實(shí)現可視化展示,提高數據的利用效率。
搜索監管業(yè)務(wù)使用的大數據資源非常專(zhuān)業(yè)化,對原始數據整合是不可能的,因此數據整合主要是在結果層次上,這種應用要從大數據中搜索特殊的個(gè)體數據,數據整合主要是整合搜索出的結果數據,建立特殊目標的數據庫,例如建立違規黑名單、收集欺詐洗錢(qián)懷疑目標等等,減少服務(wù)風(fēng)險等。
對感知網(wǎng)渠道獲取的監管大數據資源的整合主要是建立可視化圖形系統及建立監管預警的標準,提升系統的自動(dòng)化預警、報警能力,可視化系統可以提升環(huán)境安全態(tài)勢的直觀(guān)性,有助于管理人員更方便地理解態(tài)勢。
記錄用戶(hù)的金融行為可以建立用戶(hù)的征信數據庫,記錄用戶(hù)的交通駕駛行為可以建立用戶(hù)交通風(fēng)險數據庫。
信息決策應用特點(diǎn)
信息決策應用模式主要用于政府和企業(yè)的領(lǐng)導層決策,政府宏觀(guān)決策需要多方面的信息,政府不會(huì )靠數據直接決策,先要從數據集提取信息,并與已有的信息、經(jīng)驗結合起來(lái)進(jìn)行判斷,進(jìn)而制定出帶有普遍性的政策。高層決策信息更多來(lái)自小數據,小數據宏觀(guān)性好,容易看懂,而很少會(huì )利用大數據,大數據處理復雜,只有經(jīng)專(zhuān)家處理后濃縮的信息可供領(lǐng)導層決策參考。
大數據對政府高層決策貢獻不大,因為數據量越大其涉及的信息面反而越窄,政府決策需要依賴(lài)很多不能數字化的信息,如社會(huì )經(jīng)濟發(fā)展態(tài)勢,重大的國際國內事件,社會(huì )公眾的情緒意見(jiàn)等,宏觀(guān)決策使用數據的規模并不大,主要是掌握趨勢,而這些數據主要來(lái)自統計數據。
城市領(lǐng)導的主要工作是解決城市發(fā)展中的一些棘手的問(wèn)題,監督與激勵部門(mén)領(lǐng)導做好分管的工作,領(lǐng)導干部的決策能力是長(cháng)期工作積累的結果,數據與信息的作用是潛移默化的,很少出現利用數據資源對某項決策進(jìn)行輔助決策的局面。領(lǐng)導層的洞察力主要在于平時(shí)對數據與信息的利用。
領(lǐng)導層的信息來(lái)源更多是通過(guò)人際渠道,數據利用主要是統計數據,會(huì )更多利用專(zhuān)家們研究的成果,領(lǐng)導層會(huì )非常關(guān)心其它地區的做法,特別是規模相當城市的數據及采取的一些舉措。
領(lǐng)導層最關(guān)注的是整體的態(tài)勢,包括全球、全國、本省、本市的基本數據,這些數據主要是統計數據,數據量不需要很大但查詢(xún)要方便,尤其本地區數據是工作匯報的重要內容。對領(lǐng)導層而言查詢(xún)方便比數據完整更重要。
除了關(guān)注宏觀(guān)統計數據之外,領(lǐng)導層通常很關(guān)注類(lèi)似規模地區的發(fā)展數據、相關(guān)政策措施,地區數據中心要多收集此類(lèi)數據供領(lǐng)導層參閱,經(jīng)濟專(zhuān)家對形勢的分析也為領(lǐng)導關(guān)注,專(zhuān)家的文章往往太長(cháng),領(lǐng)導時(shí)間稀缺看不下來(lái),數據中心可整理出摘要供領(lǐng)導查閱。
經(jīng)營(yíng)優(yōu)化應用場(chǎng)景
經(jīng)營(yíng)優(yōu)化主要適用于企業(yè)應用特別是企業(yè)自用大數據資源的應用。亞馬遜利用自己積累的數據來(lái)分析用戶(hù)的購買(mǎi)喜好,成功地向用戶(hù)推薦新書(shū),電信運營(yíng)商利用大數據挖掘用戶(hù)的使用習慣定向推薦服務(wù)套餐,大型商場(chǎng)利用自動(dòng)收款機分析用戶(hù)的消費心理,這些大數據的使用方法都是圍繞著(zhù)公司業(yè)務(wù)進(jìn)行的,旨在改進(jìn)公司銷(xiāo)售,互聯(lián)網(wǎng)公司利用大數據改進(jìn)廣告收益,金融公司使用大數據降低金融風(fēng)險。
政府本身并沒(méi)有太多的大數據資源,政府數據還是以小數據為主,即使把眾多小數據整合起來(lái)還是小數據規模,用好小數據應是政府數據整合的重點(diǎn)。但是政府可以與擁有大數據的企業(yè)合作,利用企業(yè)的數據資源與信息渠道改進(jìn)政府工作。國家信息中心與螞蟻金服和騰訊網(wǎng)絡(luò )合作,共同收集各地智慧城市公眾反映大數據來(lái)評價(jià)智慧城市發(fā)展水平取得了很好的效果。
企業(yè)大數據資源主要來(lái)自本公司業(yè)務(wù),這種大數據資源最適合改進(jìn)本公司業(yè)務(wù),目前發(fā)展得也最快。政府利用企業(yè)的大數據資源有一定難度,企業(yè)原始數據不愿意給政府,因企業(yè)需要保護公司用戶(hù)的隱私及公司的商業(yè)秘密。政府不必非要企業(yè)的原始數據,可以訂購企業(yè)的分析成果與可視化數據產(chǎn)品,這類(lèi)數據產(chǎn)品不侵害企業(yè)利益因而企業(yè)愿意配合。
企業(yè)利用大數據資源改進(jìn)業(yè)務(wù)有自身的需求,政府并不需要進(jìn)行管理,企業(yè)向社會(huì )開(kāi)放大數據資源是市場(chǎng)行為政府也不需要干預。政府可以采購企業(yè)大數據資源的加工成果,如大數據分析報告、大數據可視化產(chǎn)品等,政府可以規劃城市所需的多種大數據產(chǎn)品,向社會(huì )開(kāi)放數據產(chǎn)品采購清單,向企業(yè)系統采購,不僅政府自用還將向社會(huì )開(kāi)放,使大數據資源物盡其用。
三、 需求導向創(chuàng )造效益
信息資源爆炸時(shí)代數據資源早已不再稀缺,信息會(huì )通過(guò)各種方式向外泄漏,想回避都不容易。按照經(jīng)濟學(xué)理論,供應增加必然帶來(lái)邊際效用下降,數據價(jià)值下降是不可避免的趨勢。
數據價(jià)值下降是競爭的結果,以提供信息為目的的數據價(jià)值下降最快,因為類(lèi)似的數據太多了,政府內部的數據資源會(huì )受到外部資源的激烈競爭。以提供信息為主要目的的數據中心會(huì )喪失原有的重要性。
政府的業(yè)務(wù)數據卻不會(huì )受到外部競爭,業(yè)務(wù)數據是用戶(hù)辦事過(guò)程記錄的數據,是繼續辦事的依據不可被替代,在政府服務(wù)精細化改進(jìn)中會(huì )有更大作用,整合的業(yè)務(wù)數據會(huì )不斷增值,這應當是數據中心今后工作的重點(diǎn)。
數據整合是提升應用效益的工具,數據整合本身并不是目標,工具并不是效益的來(lái)源,恰當的目標選擇才是效益的來(lái)源,選擇就是在增添智慧。政府數據整合既然不是終極目標就不必整合全部數據,只需整合有用的數據,要選擇那些使用頻率高、使用價(jià)值高的數據入手,放棄使用率不高的數據整合,集中精力將有用的數據整合做得更好。
信息共享做不好的原因之一是捆綁了通用平臺,想靠信息共享交換平臺來(lái)解決不同的信息共享問(wèn)題,結果與設想大相庭經(jīng),在沒(méi)有積累大量具體經(jīng)驗之前開(kāi)發(fā)通用系統是不會(huì )成功的,數據整合工作要吸取這一教訓,先從具體項目入手,特殊目標效益未實(shí)現之前,不要搞普遍性解決方案。
現在國家發(fā)改委、網(wǎng)信辦等十部委聯(lián)合提出了“一號、一窗、一網(wǎng)”的惠民服務(wù)要求,這已經(jīng)是一項非常具體的要求,能夠實(shí)現上述服務(wù)需要的跨部門(mén)數據使用已不容易了,即使在該任務(wù)中,也要挑選最重要、最有影響、使用頻率高而無(wú)重大難點(diǎn)的任務(wù)先做,以用戶(hù)滿(mǎn)意率提升為中心,完成任務(wù)是當務(wù)之急。通用平臺讓軟件公司去想,政府不必自找麻煩。
國內大數據應用才剛剛開(kāi)始,很多地方還處于既無(wú)經(jīng)驗又無(wú)資源的階段,建設大數據中心實(shí)在勉為其難,不如集中精力把小數據應用做好,大數據應用可讓大企業(yè)和大城市多試,待他們成功了再學(xué)不遲。政府應用大數據沒(méi)有競爭性,早做晚做沒(méi)有差別,政府不必學(xué)企業(yè)爭先恐后地大數據,把公眾急需的小數據服務(wù)做好就是成功之路。
延伸閱讀: 胡小明:為電子政務(wù)服務(wù)的大數據之觀(guān)點(diǎn)摘要 關(guān)于政府電子政務(wù)服務(wù)的大數據,我們在這里因為大數據太熱了。我覺(jué)得這里面有風(fēng)險,希望我們在研究大數據的時(shí)候,我們不要被大數據熱沖昏頭腦。所以應該把這個(gè)問(wèn)題想清楚,哪些是可以解決的,哪些是不能解決的。 平常心對待大數據 第一是要以平常心對待大數據,在宣傳熱的情況下,我們發(fā)現我們更多講的是大數據的技術(shù)、大數據的手段改進(jìn)。而對大數據的實(shí)際應用,仔細來(lái)看真正的例子還是少的。我們講數據挖掘,講這么多年之后,講數據挖掘還是啤酒尿布,這說(shuō)明問(wèn)題呢?說(shuō)明在應用領(lǐng)域和技術(shù)領(lǐng)域這兩者差距還是非常大的。 而現在我們需要的從實(shí)際當中來(lái)考慮這個(gè)問(wèn)題,我覺(jué)得大數據有點(diǎn)被慣壞了。目前大家都在說(shuō)成立大數據機構,申請大數據經(jīng)費。但是從大數據實(shí)際應用來(lái)看,我覺(jué)得我們并不是很明確。到底解決什么事情,它能不能做呢?還有很多問(wèn)題,我覺(jué)得大數據從我看來(lái),它只是一個(gè)工具。它永遠是我們要做目標的仆人。希望大數據的發(fā)展和應用,不要走信息資源共享的路,信息資源共享喊了很多年。從國新辦的17號文開(kāi)始到現在已經(jīng)搞了十五年了。但是在信息資源共享方面到底有多大的進(jìn)步能說(shuō)出來(lái),我認為一直沒(méi)有做好,也沒(méi)有說(shuō)出太多東西。當然這里面的原因是非常多的,為什么會(huì )這樣呢?我覺(jué)得有一個(gè)非常重要的原因,就是我們把數據資源共享的能力和效果想的太高了,我們以為它能夠解決多少問(wèn)題,實(shí)際上它并不能解決那么多問(wèn)題。 隨著(zhù)社會(huì )數據資源的增加,信息共享手段的增加,政府那點(diǎn)數據共享它能所做的貢獻是越來(lái)越少的。并不是所有的信息共享都是有用的,可以說(shuō)多數的信息共享并不是很方便。而且他們的成本效益并不都是正的,在這種情況下,你要求全面的信息共享肯定是失敗的,正確的做法應該是仔細挑選,可能十項里面只有一兩項是好的,你有什么必要推全面的信息共享呢?所以集中精力來(lái)做真正有效率的事情,這才是我們該做的。所以說(shuō)在大數據方面來(lái)講,我們一定要以目標位中心,以平常心來(lái)對待大數據。以目標位中心就是不是所有的大數據都是有用的,可以說(shuō)大部分的大數據都是沒(méi)有用的,真正有用的東西是少部分的,你必須把有用的挑出來(lái)。當你想解決什么問(wèn)題的時(shí)候,這時(shí)候你再談大數據,我認為是有價(jià)值的。當你的問(wèn)題還不清楚想用大數據的時(shí)候,我認為這完全是錯的,它根本沒(méi)有用。因為數據資源是不缺的,數據也可以是垃圾。最缺的是你的目標,你到底想干什么,現在我們最大的問(wèn)題是我們想干什么不清楚,所以我覺(jué)得這是一個(gè)很大的問(wèn)題。 目前我們對大數據概念,大家講的都是不一致的,講的都不清楚。對于政府的官員來(lái)講,他認為我的政府數據很多,我只要把數據合起來(lái)就是大數據。因此他認為他的一切數據都是大數據,你整合起來(lái)就多了。為什么會(huì )有這種想法呢?有很多的原因,其中一個(gè)原因你掛上大數據能夠申請經(jīng)費,能夠得到重視,能夠符合潮流。如果你沒(méi)有掛上大數據,你是小數據的整合。所以這個(gè)問(wèn)題也是一個(gè)因素,但是這些問(wèn)題都不重要,最重要的到底什么能解決問(wèn)題,這是最重要的。 另一個(gè)方面來(lái)說(shuō),我們現在看的大數據,大部分是基本大數據的概念,是從互聯(lián)網(wǎng)公司來(lái)的?;ヂ?lián)網(wǎng)公司它有了很高的技術(shù),它能夠利用起來(lái)大數據。因此這個(gè)概念基本上是由互聯(lián)網(wǎng)巨頭決定的,過(guò)去也有預測、石油勘探它也是一堆數據,但是都不說(shuō)它是大數據?;ヂ?lián)網(wǎng)出來(lái)之后它創(chuàng )造了一種經(jīng)濟,也就是說(shuō)一個(gè)名詞,一個(gè)概念的出現是和應用結合起來(lái),應用可能帶來(lái)有效的東西。它就是來(lái)自互聯(lián)網(wǎng)大數據的概念,而政府大數據它基本的概念還是傳統的,這兩個(gè)是不一樣的,所以政府大數據整合,并不是我們現在所講的大數據數據。而是我們傳統的數據整合、數據處理、數據分析,它是傳統的技術(shù)。所以這兩個(gè)技術(shù)是不一樣的,它們的概念不一樣。 傳感器大數據 然后是傳感器大數據,為什么?因為我們技術(shù)的發(fā)展出現了非常多的傳感器,而這些傳感器,它收集的數據是非常多的,這種數據用在什么地方呢?用于人工智能。比如說(shuō)無(wú)人駕駛汽車(chē)以及機器人等等這樣的技術(shù),他們也用這個(gè)技術(shù)。但是這個(gè)技術(shù)多不多,量大不大,我覺(jué)得不是最大。它最重要的特點(diǎn)是什么呢?就是數據處理的過(guò)程當中沒(méi)有人的干預,它是自動(dòng)化的,所以它們屬于人工智能這方面的大數據。 當我們在分析這個(gè)問(wèn)題的時(shí)候,我們要關(guān)注一下當前你想解決什么問(wèn)題,其實(shí)對不同地區是不一樣的。比如說(shuō)互聯(lián)網(wǎng)和傳感器大數據,什么工業(yè)4.0類(lèi)似這些東西都跟這些有關(guān),對于政府改善服務(wù),它最主要的是整合大數據,這個(gè)大數據主要還是在傳統的數據范圍內,他們需要的技術(shù)是不一樣的。 對于政府來(lái)講,最重要的東西經(jīng)常是最簡(jiǎn)單的,永遠是這樣,重要的都是簡(jiǎn)單的。如果它不簡(jiǎn)單,它就不會(huì )重要,重要的都是簡(jiǎn)單的。我們現有的數據改善服務(wù),這種服務(wù)全部都是在大大數據范圍內,只是我們說(shuō)大數據,但是從技術(shù)來(lái)講他們都是傳統的技術(shù)使用和改進(jìn)?;ヂ?lián)網(wǎng)數據也可以來(lái)做,但是它并不會(huì )在政府工作改進(jìn)上占據主要的位置,因此對于我們政府的工作來(lái)講,核心的問(wèn)題是小數據整合最重要,這才是最重要的。 互聯(lián)網(wǎng)大數據改進(jìn)是專(zhuān)業(yè)部門(mén)做的,傳感器大數據用于工業(yè)智能,用于人工智能改進(jìn),建立各種各樣的智能系統,它們是有用的。 大數據不適合大決策 下面我再講一下大數據并不適合于大決策,大家都知道小數據適合大決策,原因是什么呢?當我們的數據量太多的時(shí)候,畢竟你關(guān)注的范圍要窄,你關(guān)注的范圍窄,你的量才能大,才能深,這么以來(lái)你對問(wèn)題的看法和視角都狹窄。我們處理大決策的問(wèn)題它需要廣闊的視角。對于具體的問(wèn)題來(lái)講,大數據適合于解決小問(wèn)題。 另外,很多問(wèn)題是沒(méi)有辦法依靠大數據的,比如說(shuō)國際形勢發(fā)生了變化,現在網(wǎng)上經(jīng)常在討論說(shuō)希拉里和川普他們倆誰(shuí)上臺,他們倆上臺政策不一樣,你該怎么處理,對世界經(jīng)濟影響也不一樣。像這樣的問(wèn)題你能不能用大數據來(lái)分析,我覺(jué)得是不可能的。但是絕不可能分析出他們的政策會(huì )帶來(lái)什么樣的改變,因為這些東西來(lái)講是未來(lái)的東西。比如說(shuō)經(jīng)濟發(fā)展美國十幾年前的9.11事件,出了很多問(wèn)題,而這些問(wèn)題對中國經(jīng)濟發(fā)展是有利的,為什么?因為把美國搞亂了,中國有很多的機會(huì )。這樣重大的政策反而不是大數據能夠搞出來(lái)的,原因是什么呢?當你數據量太大的時(shí)候,你的視野不一定狹窄,如果你的視野寬闊你的數據量并不那么多。所以正因為這個(gè)原因,我們要想清楚。 高層決策最主要是靠全面信息,而不是狹窄的數據。我談了大數據的服務(wù)問(wèn)題,因為我現在在深圳,我幫他們來(lái)討論一些問(wèn)題,他們總覺(jué)得政府的數據資源非常多。我要打通把數據整合,然后我就可以分出來(lái)很多東西來(lái)支持政府,這是它的一種基本思想。但是這種基本思想一般來(lái)說(shuō)是不行的,為什么?政府的數據實(shí)際上一點(diǎn)也不多,總說(shuō)政府資源占90%,那些都是三十年前的概念,因為那時(shí)候沒(méi)有互聯(lián)網(wǎng)?,F在互聯(lián)網(wǎng)巨頭不比政府的數據多十倍、百倍、千倍。而且政府的數據主要來(lái)自于人工調查,人工調查的效率和機器識別的數據是不一樣的。所以政府的數據是很少的,你可以把它集合起來(lái)解決問(wèn)題。但是你不是需要靠大數據來(lái)分析,而是靠轉動(dòng)的數據分析,來(lái)挖掘政府數據的潛能,所以這個(gè)很重要。 在這種情況下,如果政府把所有的數據都整合了,然后等著(zhù)你去打通,去分析出結果,這樣行嗎?政府信息資源雖然沒(méi)有開(kāi)放,但是沒(méi)有不透風(fēng)的墻,政府信息代表的東西都會(huì )通過(guò)各種各樣的渠道傳遞出去,包括我們的手機、聊天、談話(huà)等等。所以在這種情況下,你想有一個(gè)非常重大的發(fā)現出來(lái)是不容易的。 如果你能夠發(fā)現這些重大信息,你這些能力如何給政府提供。實(shí)際上我們提出的東西對政府的官員來(lái)講你的東西是小兒科,是外行。你要依賴(lài)大數據政府是不放心的。在這種情況下,你把各種各樣的數據整合起來(lái),讓它變成一個(gè)可視化的服務(wù)這反而是有效的。一個(gè)可視化的服務(wù)隊政府官員來(lái)講是很歡迎的,就像我們天天都要看天氣預報。我們看天氣預報一個(gè)月幾次臺風(fēng),可視化數據能夠迅速的一眼能夠對整體有一個(gè)改觀(guān)。所以說(shuō)對于政府領(lǐng)導來(lái)講,你提供一個(gè)可視化的圖,包括云圖和變化圖。 人工智能發(fā)展的過(guò)程當中,也是有一個(gè)進(jìn)程的。在六七十年代,當時(shí)人工智能非?;?,搞來(lái)搞去做不下去了。后來(lái)人們也做機器發(fā)現做來(lái)做去也做不下去了,什么時(shí)候開(kāi)始這輪又起來(lái)了,核心是它把人工智能改成了大數據,改成了數據學(xué)習。實(shí)際上里面包含的信息,比如說(shuō)機器翻譯,以前我也見(jiàn)國際歌搞翻譯的人,那時(shí)候的思想是造型和理解的角度來(lái)翻譯,現在發(fā)現越來(lái)越做不下去的?,F在的翻譯是怎么做的,上一句話(huà)是這個(gè),下一句話(huà)是那個(gè),什么概率最高用那個(gè),別的東西不管。哪個(gè)詞出現的頻率最高就用哪個(gè),現在我們發(fā)現我們的軟件越來(lái)越快,就是一般打這個(gè)字,下個(gè)字什么概率最高就提出來(lái),這樣對你加快速度就更容易了。 智能化的城市也和我們的大數據應用緊密的結合起來(lái),它這種應用和我們決策的應用是不一樣的。實(shí)際上數據有兩種情況,一個(gè)是用在人工智能領(lǐng)域,它應用的系統是自動(dòng)化的,而提出來(lái)之后機器自己來(lái)用,因為計算機本身你別看它總是數據,但是它一點(diǎn)都不懂信息,它腦子里面只有數據的概念,它碰到數據算概率,沒(méi)有別的概率。但是人決策不一樣,它會(huì )把所有的數據拿過(guò)來(lái)看一遍、想一遍,這兩個(gè)用途是不一樣的。所以說(shuō)機器使用大數據和人來(lái)使用大數據它是兩種不同的使用方式,你會(huì )知道為什么人使用大數據結果是不確定的,機器數據是死的。 當我們在研究大數據的時(shí)候,一定要從應用出發(fā),而不能從資源出發(fā)。一個(gè)數據,它是資源,還是垃圾,我們不要認為所有的數據都是資源。因為資源和垃圾它倆沒(méi)有區別,資源就是垃圾,垃圾就是資源,完全取決于不同的人在這里看,資源和垃圾本身上是一樣的,就好像你想刪掉就刪掉,你刪掉的就是垃圾,你不刪掉的就是資源,所以垃圾和資源是同一個(gè)東西。我們如何區分,它判斷標準就是對人工的幫助,所以這就是要注意的事情,我們不能從資源出發(fā),現在我覺(jué)得在全國各地處理推廣大數據的時(shí)候有一個(gè)觀(guān)點(diǎn)我是非常懷疑的,各地做的頂層設計里面。你到底是解決什么問(wèn)題,你先把數據收集過(guò)來(lái)。 大數據的發(fā)展要在應用中成長(cháng),而不是在大樓中成長(cháng),這是什么大數據呢?實(shí)際上你發(fā)現有很多大數據確實(shí)可以解決問(wèn)題,它還需要長(cháng)期不斷的積累,不斷的改進(jìn)。因此有效的大數據你不斷的維護它和改進(jìn)它,它在應用中成長(cháng),而不是在你的大樓中成長(cháng)。 所以如果你沒(méi)有想清楚做什么,你的大數據組織是非常危險的,它會(huì )浪費你很多的資源。你搞一堆垃圾,你還想升官,那樣肯定不行,因此你不能這么做,你要挑出來(lái)有用的東西,在應用中不斷改進(jìn),也許它所用到的數據,只是幾十分之一就可以了。我的數據賣(mài)給你,當時(shí)我想賣(mài)一點(diǎn)錢(qián),他說(shuō)我不要,我說(shuō)你為什么不要,他說(shuō)我要等我的用戶(hù),我的用戶(hù)咨詢(xún)到哪一個(gè)我買(mǎi)哪一個(gè),寧可貴一點(diǎn)我也要,我不要你們企業(yè)的數據,他用的是這樣來(lái)想的。 在這樣的情況下,我們就需要在大數據當中我們要進(jìn)步,對高層的服務(wù)和對基層的服務(wù)是不一樣的。政府的數據整合最重要的是基層的服務(wù),整合的數據對基層的服務(wù)有用,對高層的服務(wù)它要了解外體和整體,它并不需要精確的數據。所以我們要把精確的數據送到前線(xiàn),什么是前線(xiàn)呢?直接為公眾服務(wù)的,他知道這家是困難戶(hù),這家收入多少。然后把整體的趨勢可視化的圖形送領(lǐng)導,這樣領(lǐng)導一眼就知道大概的趨勢,這樣的話(huà)才會(huì )更有效。 我們要以解決問(wèn)題為中心,真正能解決問(wèn)題的東西不見(jiàn)得數據量大才是能解決問(wèn)題的。 我舉一個(gè)例子,美國友一家公司,這個(gè)公司花錢(qián)花的太多,每一個(gè)公司都超預算非常頭疼,于是派了一位領(lǐng)導解決這個(gè)問(wèn)題。一開(kāi)始把帳單都打出來(lái)看看有什么不合格,后來(lái)計算機打出來(lái)他根本沒(méi)有辦法看,誰(shuí)浪費最多,排第一,每次超支最多的,每個(gè)月發(fā)一份,然后他就不管了,各個(gè)部門(mén)都怕自己的排名表靠前,于是很快就把這個(gè)問(wèn)題解決了。解決這個(gè)問(wèn)題并不是靠大數據分析來(lái)解決的,而是靠排名表解決的,所以說(shuō)很多問(wèn)題要以解決問(wèn)題為中心,大數據并不是唯一的工具。 大數據被政府慣壞了,只會(huì )花錢(qián)不會(huì )干活了。所以我們要先整合好小數據,所以數據的應用應當始于足下,而不要讓大數據誤導,這是我講的一些想法,謝謝大家。
來(lái)源:胡小明,原國家信息中心副主任
聯(lián)系客服