199IT數據中心微信賬戶(hù):i199IT
本文摘自穆勇在中關(guān)村大數據產(chǎn)業(yè)聯(lián)盟上所做的演講。
一、大數據在政務(wù)領(lǐng)域應用的概述
說(shuō)起大數據技術(shù)的應用,首先是在互聯(lián)網(wǎng)行業(yè)起步并逐步拓展到電信、金融、工業(yè)等多個(gè)領(lǐng)域,產(chǎn)生了巨大的社會(huì )價(jià)值和產(chǎn)業(yè)空間,現正拓展到政務(wù)領(lǐng)域。
(一)大數據技術(shù)在互聯(lián)網(wǎng)行業(yè)的成功應用,那些地方是值得我們關(guān)注的
第一,應該是思維觀(guān)念和運作方式的變化,所謂的互聯(lián)網(wǎng)思維,其核心理念包括:
體外互動(dòng):郵件、電話(huà)、信件互動(dòng)---服務(wù)導引
服務(wù)外包:購買(mǎi)服務(wù)---簡(jiǎn)單服務(wù)
讓渡社會(huì ):眾包---自助服務(wù)
邊界開(kāi)放:數據開(kāi)放---創(chuàng )造服務(wù)
第二,是其技術(shù)演進(jìn),針對數據處理的技術(shù)
首先是傳統數據分析處理階段,該階段是面向結構化數據,非結構化處理效率低;硬件成本高;平臺兼容性差。其次是基于云計算的大數據處理階段,該階段總體有了很大的改進(jìn)和提升,主要體現在:具備結構化/非結構化混合分析的能力;基于消費級硬件,不依賴(lài)高性能、高可靠性硬件,從而保障系統性能和可靠性;平臺兼容性好、擴展性高;進(jìn)而業(yè)界又提出去IOE的思路。
第三,是數據挖掘分析技術(shù)
畫(huà)像技術(shù)以及各類(lèi)數據融合、分析、挖掘、預測等。
這些都是政務(wù)領(lǐng)域需要學(xué)習與借鑒的。為此,我認為:大數據在政務(wù)領(lǐng)域應用即包括用新的思維、模式與技術(shù)來(lái)解決電子政務(wù)需求,也包括了政務(wù)大數據新的應用。對于第一個(gè)方面比較容易理解,對于第二個(gè)方面需要對政務(wù)大數據給出定義。有些人認為政府沒(méi)有大數據,只有傳統的小數據或中數據。這個(gè)問(wèn)題我們將在下一節專(zhuān)門(mén)中進(jìn)行討論。
政務(wù)領(lǐng)域是大數據應用嶄新的領(lǐng)域,它將極大的改變政府的管理模式,有利于節約政府投資、提高政府決策能力、提升公共服務(wù)和社會(huì )管理能力,開(kāi)展大數據在政務(wù)領(lǐng)域的應用是大勢所趨,勢在必行。同時(shí),政務(wù)大數據本身也不同于其他領(lǐng)域或行業(yè)的數據,其復雜程度和需求的多樣化比互聯(lián)網(wǎng)行業(yè)大的多,也難的多。
(二)政務(wù)大數據的定義及特點(diǎn)
按照政府管理的數據來(lái)源和種類(lèi),可以分為下三類(lèi):
第一類(lèi)業(yè)務(wù)數據:業(yè)務(wù)辦理過(guò)程中采集和產(chǎn)生的數據。
第二類(lèi)民意社情數據:對社會(huì )企業(yè)個(gè)人對象進(jìn)行統計調查獲得的數據。
第三類(lèi)環(huán)境數據:通過(guò)物理設備采集獲得的氣象、環(huán)境、影像等數據。
在以前的電子政務(wù)建設階段,政務(wù)信息資源開(kāi)發(fā)利用更多的是集中在前兩種類(lèi)型和結構化數據上,而對第三類(lèi)數據,特別是實(shí)時(shí)的、非結構化、半結構化數據的開(kāi)發(fā)利用相對較少。隨著(zhù)政府業(yè)務(wù)在互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)等領(lǐng)域廣泛和深入的應用,第三類(lèi)數據的數據量和價(jià)值都在迅速增長(cháng),相關(guān)數據處理技術(shù)也逐步成熟。便于區別不妨把包含第三類(lèi)數據的政務(wù)信息資源叫做是政務(wù)大數據。
政務(wù)大數據與其他領(lǐng)域大數據相比具有鮮明的特點(diǎn):
體積大,增速高:涵蓋經(jīng)濟社會(huì )管理的方方面面,數據積累量巨大。每年處理的數據呈指數級增長(cháng)。
種類(lèi)多,價(jià)值大:以宏觀(guān)經(jīng)濟基礎數據為例:涵蓋經(jīng)濟、社會(huì )、醫療、環(huán)境、工農業(yè)、教育、旅游等社會(huì )關(guān)鍵領(lǐng)域數據,具有極為重要的社會(huì )和經(jīng)濟價(jià)值。
壟斷性,難獲得:政府部門(mén)及公共企事業(yè)單位采集數據有些是專(zhuān)營(yíng)的業(yè)務(wù),一般企業(yè)是采不到,也買(mǎi)不到。
通過(guò)以上可以看出,政務(wù)大數據同傳統數據相比,不僅包括結構化數據,更包括大量非結構化數據,且具有數據量大、應用價(jià)值大、速度快、種類(lèi)繁多等特點(diǎn)。
我們要高度重視大數據應用對政務(wù)工作正在帶來(lái)和將要帶來(lái)的各種影響,充分認識推進(jìn)大數據應用的必要性和緊迫性,加強頂層設計,分專(zhuān)業(yè)分步驟實(shí)施。
開(kāi)展政務(wù)領(lǐng)域的大數據應用首先是觀(guān)念、思路的轉變,轉變電子政務(wù)建設主體,由政府營(yíng)造創(chuàng )新發(fā)展環(huán)境,引導企業(yè)為主體開(kāi)展電子政務(wù)建設,同時(shí),我們政府也需要在實(shí)際工作中給予支持和指導,一方面采用給予適當的政府補貼和協(xié)助優(yōu)秀電子政務(wù)解決方案的推廣應用等方式,幫助初創(chuàng )企業(yè)快速成長(cháng);另外,在社會(huì )服務(wù)領(lǐng)域,政府退到后臺,提供數據和基礎服務(wù),讓企業(yè)直接面向社會(huì )提供貼近需求的服務(wù)。大數據在政務(wù)領(lǐng)域的應用可以涉及到政務(wù)領(lǐng)域方方面面,今天因為時(shí)間有限,就領(lǐng)導決策、社會(huì )管理、公共服務(wù)等幾個(gè)方面做簡(jiǎn)單說(shuō)明。
領(lǐng)導決策
大數據的包容性將打開(kāi)政府各部門(mén)間、政府與公眾間的邊界,信息孤島現象大幅消減,數據共享開(kāi)放成為可能,而數據開(kāi)放使得公眾更多的參與決策,這勢必直接影響組織怎樣作決策、誰(shuí)來(lái)決策,甚至將改變決策過(guò)程和結果,同樣會(huì )帶來(lái)如下本質(zhì)的改變:
直覺(jué)的判斷被迫讓位于精準的數據分析,人類(lèi)必須依靠數據作決策,甚至將決策權完全交給數據。
公眾多途徑參與,必將深入影響政府決策。
社會(huì )管理
政府數據與互聯(lián)網(wǎng)數據相結合,分析艾滋病。
公共服務(wù)
通過(guò)對政府面向市民的互動(dòng)數據的分析,為市民提供更精細化和個(gè)性化的服務(wù),如對政府呼叫中心海量非結構化的語(yǔ)音數據、服務(wù)過(guò)程和服務(wù)問(wèn)題的分析處理,深度挖掘客服語(yǔ)音數據價(jià)值,可以更好的支撐服務(wù)和營(yíng)銷(xiāo),進(jìn)一步改進(jìn)政務(wù)呼叫中心工作。另外通過(guò)大數據搜集和分析民眾關(guān)心的問(wèn)題,包括輿情、口碑等。為市民提供更好的服務(wù)。
二、政務(wù)大數據應用基礎和前提
開(kāi)展政務(wù)大數據應用,需要具備哪些基礎工作和必備條件。在政務(wù)領(lǐng)域開(kāi)展大數據應用并不是從零開(kāi)始,我們各級政府開(kāi)展電子政務(wù)工作已經(jīng)多年,在很多領(lǐng)域都做了很多工作,為政務(wù)大數據應用奠定堅實(shí)的基礎,歸納起來(lái)有以下幾個(gè)方面:
在信息資源管理的規章、制度、標準方面,國家和北京市政府相應制定并出臺一系列規章制度,如《關(guān)于加強信息資源開(kāi)發(fā)利用工作的若干意見(jiàn)》(中辦發(fā)[2004]34號、《中華人民共和國政府信息公開(kāi)條例》(國務(wù)院令第492號,2007)、《關(guān)于加強政務(wù)信息資源管理的若干意見(jiàn)》(京信發(fā)[2009]2號)、《北京市信息化促進(jìn)條例》(2007),第三章為信息資源開(kāi)發(fā)利用、《政務(wù)信息資源共享交換平臺管理辦法》(京信辦發(fā)[2008]13號)等。
強化政務(wù)信息資源管理的基礎工作,如為加強電子政務(wù)基礎工作,2006年市信息辦發(fā)布《關(guān)于加強部門(mén)電子政務(wù)基礎工作的通知》,要求全市各部門(mén)按照“四清兩統一” 要求,做好業(yè)務(wù)、服務(wù)和信息資源梳理與目錄編制工作等基礎工作。
信息資源基礎建設設施方面,包括建立了完善的市共享交換平臺、物聯(lián)網(wǎng)應用支撐平臺、移動(dòng)管理平臺、政務(wù)云、四大基礎庫、各類(lèi)重要信息系統及信息資源庫350余等基礎設施及核心業(yè)務(wù)信息方面工作。
這些工作為開(kāi)展政務(wù)領(lǐng)域大數據應用奠定堅實(shí)的基礎。
三、北京市市級大數據平臺頂層設計框架
大數據在政務(wù)領(lǐng)域應用,區別于以往重要一點(diǎn)是:更加強調的事政務(wù)大數據的開(kāi)放和共享,一是委辦局之間政務(wù)數據資源的共享,二是面向社會(huì )公眾開(kāi)放政務(wù)數據資源。政府部門(mén)及相關(guān)公共企事業(yè)不但要盡可能地開(kāi)放數據資源,還要以購買(mǎi)服務(wù)或資源換投資等方式引入政務(wù)應用與服務(wù),發(fā)揮社會(huì )與市場(chǎng)的力量改善政府服務(wù)能力。政府數據的開(kāi)放共享是大數據在政務(wù)領(lǐng)域應用的條件或前提。一些單位,如北京、上海分別建立了專(zhuān)門(mén)的網(wǎng)站,匯集各政府部門(mén)可開(kāi)放的、有經(jīng)濟和社會(huì )利用價(jià)值的數據資源,為社會(huì )企業(yè)或個(gè)人服務(wù)開(kāi)發(fā)者提供各類(lèi)實(shí)時(shí)與非實(shí)時(shí)數據的下載和服務(wù),目前已經(jīng)取得了一些的成效,并舉辦了推廣活動(dòng)。如北京市政務(wù)數據資源網(wǎng),成功舉辦了“2014年北京市政務(wù)數據資源網(wǎng)應用創(chuàng )意大賽”,得到了社會(huì )公眾廣泛的關(guān)注,也涌現出了“曬公益平臺”、“優(yōu)質(zhì)幼兒園、中小學(xué)招生地圖”、“掌上交通綜合信息服務(wù)”等一批優(yōu)質(zhì)服務(wù)產(chǎn)品。
作為北京來(lái)說(shuō)我們已經(jīng)有了共享交換平臺、物聯(lián)網(wǎng)平臺還有政府數據開(kāi)放網(wǎng)站等重要的信息化基礎設施,為什么還需要重新規劃一個(gè)市級的大數據平臺?它與現有的這些平臺和系統是什么關(guān)系?與各委辦局的大數據應用系統又是什么關(guān)系?這是由他的功能定位來(lái)確定的。這個(gè)平臺不同于以往的共享交換平臺,強調的是數據的融合、使用、落地。有些數據比如涉及政府內部數據如人口數據、醫保數據等是買(mǎi)不到的。還有視頻數據不是可以隨便安攝像頭采集的。還強調了對現有平臺、系統及數據資源的調度管理。
(一)平臺定位及與其他系統關(guān)系
與委辦局大數據應用系統關(guān)系:首先,各委辦局或區縣可以按照自身業(yè)務(wù)需要建設大數據系統,也可以為市級大數據平臺提供部分數據,并可以從市級政務(wù)大數據平臺獲取各類(lèi)大數據資源。其次,各專(zhuān)項大數據應用是在各委辦自己大數據應用系統中完成。
與現有信息化基礎設施與系統關(guān)系:市級政務(wù)大數據平臺充分利用原系統和平臺已經(jīng)實(shí)現的功能,并融合現有數據和新數據,具有現有系統無(wú)法實(shí)現的海量數據快速處理能力。
(二)市級政務(wù)大數據平臺的功能目標
提供各類(lèi)數據的融合與共享服務(wù);提供空間、法人、人口基礎融合數據資;提供大數據目錄的注冊、發(fā)布、查詢(xún)、獲取、應用等服務(wù)。
向各委辦局大數據應用平臺提供大數據服務(wù)支撐,通過(guò)首都之窗、Data網(wǎng)站等辦公門(mén)戶(hù)向政府部門(mén)和社會(huì )公共提供數據使用服務(wù)。為需求單位提供大數據處理通用接口及工具,并統一實(shí)現與外部數據的接入服務(wù)。通過(guò)物聯(lián)網(wǎng)平臺、互聯(lián)網(wǎng)平臺、共享交換平臺等信息化基礎設施和系統匯集、存儲、分析相關(guān)數據資源。強調了對各類(lèi)數據的處理能力,包括對結構化的、非結構化的、音頻、視頻、包括各種結構的數據處理能力,特別是有來(lái)自于物聯(lián)網(wǎng)的實(shí)時(shí)數據,和互聯(lián)網(wǎng)的日志數據等。
下面我們來(lái)看一下,市級大數據平臺的業(yè)務(wù)模型框架、數據模型框架、技術(shù)模型框架。
(三)總體功能架構
(四)核心功能
(1)對基礎庫、物理網(wǎng)數據、互聯(lián)網(wǎng)數據、外部數據的采集匯聚。
(2)對以結構化數據為主的傳統數據的融合處理。
(3)對以非結構化、音頻、視頻等新型數據為主的融合處理。
(4)數據質(zhì)量管控:通過(guò)對數據,應用,系統綜合管理,構建標準化、流程化、自動(dòng)化、一體化的數據管理體系。
(5)跨平臺調度實(shí)現數據互聯(lián)互通,統一管控:提供跨系統跨平臺的任務(wù)調度功能,與各子系統緊密接合,涵蓋接口子系統、維護子系統、云平臺、接口分發(fā)平臺。
(五)技術(shù)架構
政務(wù)大數據平臺的技術(shù)架構采用混搭模式,一方面不改變已有的原始數據的存儲和管理方式,另一方面,采用大數據新技術(shù)處理原有方式不能處理的新數據,重點(diǎn)是對非結構化、新數據的處理。
首先,各委辦局通過(guò)市級大數據平臺可以實(shí)現數據的共享和融合,并在此基礎上開(kāi)展各自的大數據應用,如北京市有很多部門(mén)負責并參與中小企業(yè)數的統計工作,如地稅、海關(guān)、工商、經(jīng)信委等,這些部門(mén)均有各自數據采集的渠道和途徑,但是北京市到底有多少中小企業(yè),每個(gè)部門(mén)都很難說(shuō)清楚,也無(wú)法統一,對于這個(gè)問(wèn)題,通過(guò)市級政務(wù)大數據平臺數據比對、分析、處理,再經(jīng)過(guò)一定的算法得出大家一致認可的統一的中小企業(yè)數和清單,并在此基礎上進(jìn)行數據分析、數據查重等融合處理,使得原有單純交換來(lái)的數據,產(chǎn)生了本質(zhì)的變化。
其次,市級政務(wù)大數據平臺具備新數據、非結構化數據的處理能力。各單位不具備通用數據的處理以及非結構化數據的處理能力和基礎設施,而市級政務(wù)大數據平臺,充分利用市共享交換平臺、四大基礎庫、一系列門(mén)戶(hù)和網(wǎng)站實(shí)現數據的統一調度和管理,促進(jìn)數據交換和共享。
綜上所述,市級政務(wù)大數據平臺不僅可以自帶基礎數據,同時(shí)還可以匯集新數據如音頻、視頻等非結構化數據,并對數據進(jìn)行分析、處理,可以為各委辦局提供更有價(jià)值的多維度的融合數據資源。
四、智能交通大數據應用示范
(一)新一代智能交通系統對數據整合需求
交通共享交換數據中心(交通委與交管局)建設應列入日程,并統籌全市域的政府交通路況信息發(fā)布;政府部門(mén)之間數據融合共享,各類(lèi)數據包括交通領(lǐng)域、城市規劃、人口分布、法人及空間地理等數據融合共享,以從整體、系統上、研究緩解交通擁堵、保護環(huán)境的治本措施;政府TO企業(yè);企業(yè)TO企業(yè)數據共享機制,加大交通數據資源向社會(huì )開(kāi)放共享力度。
(二)交通領(lǐng)域數據與其他相關(guān)數據融合
1. 交通信息分散、碎片化情況
市交通委掌握的浮動(dòng)車(chē)實(shí)時(shí)路況信息、一卡通信息、道路基礎設施等信息,主要覆蓋范圍五環(huán)內城市道路;交管局掌握的固定檢測器實(shí)時(shí)路況信息、視頻信息、交通事件、事故、施工等信息,覆蓋范圍為環(huán)路及城市快速路;經(jīng)信委及其他局掌握的公眾出行相關(guān)的地理空間、位置圖層、應急物聯(lián)網(wǎng)信息、人口、法人等信息;電信運營(yíng)商的信令數據及互聯(lián)網(wǎng)等信息,覆蓋范圍為全市域;來(lái)自交通臺的廣播信息,來(lái)自相關(guān)互聯(lián)網(wǎng)微博、微信信息。
2. 各類(lèi)交通信息融合
采用最新的大數據融合處理技術(shù),通過(guò)市級政務(wù)大數據平臺,由大數據應用需求單位負責具體實(shí)現各方數據的匯聚、加工融合與共享交換,形成更為全面、準確、及時(shí)的完整、全市域道路實(shí)時(shí)路況及出行位置信息服務(wù)。
以上工作研究團隊成員有亞信、北航、中興、數貝、太極等?,F在正在搭建北京市政務(wù)大數據平臺及應用示范的原型系統。下面我們看一下基于這個(gè)平臺我們做的應用方案。
(三)應用案例示范
示范1:交通多源異構數據融合模型—場(chǎng)景化的空間、時(shí)間、主題的數據融合

示范2:北京市中心區域各公交站點(diǎn)的居住強度和就業(yè)強度

示范3:北京市地面公交高峰期客流量分布

示范4:城市范圍出租車(chē)聚集分析

示范5:天通苑住戶(hù)流量分析

–住戶(hù)主要通往市38個(gè)區域
–僅有8個(gè)區域具有高聚集特征
五、小結
大數據政務(wù)應用環(huán)境和相關(guān)技術(shù)還不是十分成熟,具體表現在:
在政府方面亟需出臺的制度應包括:政府數據資源開(kāi)放共享、政府數據資源安全與個(gè)人信息保護以及以市場(chǎng)手段推動(dòng)信息資源的社會(huì )化開(kāi)發(fā)利用。如《北京市國家機關(guān)個(gè)人信息保護管理辦法(送審稿)》、《北京市政務(wù)信息資源開(kāi)放管理辦法(送審稿)》、《政務(wù)信息資源資產(chǎn)化管理研究報告》。
在企業(yè)相關(guān)準備工作也未就緒,如在使用政府數據、用戶(hù)信息資源管理政策還未建立,特別是涉及個(gè)人隱私保護政策方面還是很難讓人放心,有些企業(yè)的信息使用商業(yè)色彩過(guò)于濃厚。
一些人以為有了大數據什么都可以做,國際著(zhù)名學(xué)者M(jìn)ichael I. Jordan表示:現在大家炒作大數據過(guò)了頭、大數據可能只是一場(chǎng)“空歡喜”,有些大數據技術(shù)還需要10到20年的時(shí)間才能成熟。政務(wù)大數據應用也要知道什么我們現在還做不了。
一些傳統IT企業(yè)(號稱(chēng)地派)利用熟悉的政府業(yè)務(wù)及運營(yíng)管理的系統資源開(kāi)始向上互聯(lián)網(wǎng)政務(wù)大數據應用領(lǐng)域發(fā)展;一些互聯(lián)網(wǎng)企業(yè)(號稱(chēng)天派)也利用自身的大數據技術(shù)、數據資源及經(jīng)驗向下電子政務(wù)領(lǐng)域延伸。在政務(wù)及公共服務(wù)領(lǐng)域大數據應用, “替代你,和你沒(méi)關(guān)系”在這一新的領(lǐng)域不適用,互聯(lián)網(wǎng)企業(yè)與傳統IT企業(yè)各有優(yōu)勢,關(guān)鍵是看誰(shuí)動(dòng)作更快。
今天我分享的內容已經(jīng)完了,歡迎大家就感興趣的事情進(jìn)一步交流。再次感謝顏總提供這么好的交流和分享平臺,祝大家萬(wàn)事如意!
『 WeMedia 』自媒體聯(lián)盟覆蓋千萬(wàn)人群,『199IT-互聯(lián)網(wǎng)數據中心』為其成員。
聯(lián)系客服