2017年7月26日下午,“2017政務資料治理與創新高端研討會”在北京梅地亞中心多功能廳隆重召開。本次研討會由中國資訊通信研究院、中國社科院資訊化研究中心、國脈資料研究院聯合主辦。中國資訊通信研究院高級工程師、大資料發展促進委員會辦公室主任韓涵出席會議並發表了《政務大資料—技術發展與標準化》的主題演講,闡釋了“政府戰略轉型→業務轉變→資料應用變革→雲化大資料服務”的政務大資料驅動路線以及“資料獲取→資料開放→資料共用→統籌彙聚”的政務大資料建設流程,針對資料開放共用存在的問題,她建議建立資料分級/分類機制和資料共用負責人制度。
中國資訊通信研究院高級工程師、大資料發展促進委員會辦公室主任韓涵
以下是會議現場發言實錄:
非常感謝主辦方提供的機會,今天分享中國信通院在大資料,尤其是政府大資料領域的研究進展。中國信通院是工信部直屬事業單位,是國家《大資料產業發展規劃(2016-2020)》編制單位,也是《促進大資料發展行動綱要》編制主要職能單位,信通院在大資料產業發展、標準制定、各地政府產業規劃、頂層設計、系統建設方面有一定經驗,今天把這些經驗分享給各位嘉賓。
一、我國大資料發展基本狀況
第一,領導層高度重視大資料發展,國家密集出臺政務資料開放共用相關政策。從大資料的發展來看,最高級的指示是習總書記提到建設全國一體化的大資料中心,目前網信辦在具體討論該建設方案,中國信通院也是該方案的主要支撐單位。在去年的兩會上李克強總理提到大資料是“鑽石礦”,將大資料技術放在了很高的關鍵位置上。
政府部門對於政務資料開放、共用和使用,這十幾年一直都在陸續推進相關政策,包括《政務資訊資源整合共用方案》、去年底發佈的政務服務指導意見[A1] 、6月份落地的資訊資原始目錄梳理檔[A2] ,檔發佈很密集,相關的檔有5個。同時,2004年中辦發〔2004〕34號《中共中央辦公廳國務院辦公廳關於加強資訊資源開發利用工作的若干意見》中提出了以資訊化帶動工業化、以工業化促進資訊化,充分發揮資訊資源開發利用在資訊化建設中的重要作用,推進經濟結構調整和經濟增長方式轉變,實現經濟社會全面協調可持續發展,主要的理念與政務資訊的發展如出一轍,因此資料資源的使用,十幾年以來在國家的政策中始終都沒有變過,這也可以證明大資料發展過程中的一些核心問題依然存在,面對這些問題我們如何開展工作,是需要我們產業界探討的一個方向。
第二,政府資料共用開放標準化進程不斷加快。從標準的層面,2007年國家發佈了電子政務的交換體系和目錄體系[A3] ;2007年國務院頒佈《中華人民共和國政府資訊公開條例》條例,其中要求行政機關應當主動公開政府資訊,還詳細規定了資訊公開的方式、程式、監督和保障措施等。至今十年,沒有其它新的電子政務標準發佈,不過,國家也成立了大資料領域的機構,陸續的標準正在制定和研討中,比如正在制定的大資料資源開放目錄和資訊資源分享交換國家標準正在研討當中,但落地標準仍是2007年的這套標準。從這個層面來看,電子政務標準化進程十分緩慢,總結出的一些實際困難和問題也和十幾年前一樣。在各行業層面,陸續也有一些行業標準,比如交通、公安,它們的標準在行業體系內都比較成熟。國家層面非常重視資訊化標準的建設,由網信辦牽頭,聯合質監總局和國改委發佈了《“十三五”資訊化標準工作指南》,為資訊化標準建設、標準評估、標準指南等提供一些明確的意見。
第三,大資料上升為國家戰略,全國多片區佈局綜合試驗區。從大資料的視角,國家已將大資料作為國家戰略,列入了國家“十三五”規劃編制的內容中,工業資訊化部發佈了《大資料產業規劃建設2016-2020》檔,大資料最頂級的三部委批復貴州建設國家大資料(貴州)綜合試驗區,批准7個區域建設國家大資料綜合試驗區,試驗區注重創新和突破,注重新技術的應用,注重新的產業發展的培育。目前擁有包括京津冀、珠三角和省一級內蒙古、河南、上海和重慶等在內的區域性試驗區。
全國多片區佈局綜合試驗區
第四,全國各地陸續制訂大資料發展政策規劃,開展大資料建設專案。前後有31個省市發佈了大資料相關檔,近6個月來,檔發佈更頻繁,包括地方大資料整體的設計指導意見、促進本地大資料產業發展的規劃以及推動具體項目落地的行動計畫。最近也有很多落實一些公開指導意見的地方性檔,關於落實國家政務資訊系統統籌共用的檔以及關於國家資訊資源體系的目錄檔也在頻繁發佈中。因此,對於具體的大資料項目目來說,政府在這一兩年裡來,大資料建設專案數量增長非常快,政府的占比也在增加,尤其是在從中央到地級檔的推動之下,大資料建設已從規劃戰略層面走向項目落地層面。
最後,當前政務大資料建設模式與問題。今天談到的政務大資料,把政務資料資源管理和資料治理作為一個重要角度,對於地方政府來說,政府發展大資料的目標非常清楚,主要面向三大政府需求:領導決策、政府治理和公共服務。資料資源發揮著重大價值,主要的手段就是資源的彙聚統籌和資料的共用。如何從技術的視角來促進政府大資料的建設,技術評價方案可以總結為真實、大量、快速、靈活、全面。從政府的角度,建設大資料系統,利用資料資源,整理政務資訊資原始目錄,提高政務資料品質,能夠滿足這些基本要求,從而使得資料的價值發揮更大,部署更加靈活,回應更加迅速,同時資料覆蓋維度更加全面。
同時,政府大資料的應用問題也非常顯著,2004年中辦34號文所提出的相關問題,比如資料孤島、資料互通、資料增值利用等,這些年也依然存在,實體層集中相對容易,真正的資料資源彙聚很難,從業務層面打通資料,實現協同和聯動則是難上加難。
二、政務大資料建設步驟
首先是資料獲取。資料獲取主要存在以下幾個問題:一是基層資料獲取很困難,主要體現在業務部門太小,要求複雜,口徑又不一致,沒有管理規範,品質也沒有把控的體系。為了實現建設政府大資料的基礎,對基層資料的共用和校核是一個非常重要的步驟。目前各地都在建設基礎庫或者共用主題庫的一些基本原則,提倡編制動態、靈活和可變的資訊資原始目錄體系,而不是靜態的目錄。二是屬地化資料管理困難,在資料獲取層面資訊系統縱強橫弱,區域機構難以留存資料,難以建設區域統一的資料平臺,基層資料難以形成體系。有些區域級的政府對資料掌握能力比較弱,政務資訊資源系統整合的目的以及建設政務資訊資原始目錄的目的也是加強區域級的政府對資料的掌控,同時在政務資訊資原始目錄編制的過程中,後續會採用屬地化的分層,而不是採用縱向的行業資訊資源系統主題。三是歷史珍貴資料不夠重視。最後是即時資料獲取困難。
第二是數據開放。資料開放已經成為重要的工程,目前中央網信辦正在編制資料開放試點指導檔。從2009年美國建設大資料項目目開始,在世界範圍內,政府資料開放成為一個比較重要的工作。政府資訊開放是政府和企業之間資源分享的主要手段,政府資料共用是政府和政府之間資料共用的主要方法,政府和企業之間是主要的共用手段,企業和企業之間的共用融合主要靠交易,這也是大資料發展並推動資料資源價值利用的主要手段。
從開放的角度,政府資訊公開、政務資訊共用和資原始目錄編制並不是完全一致的,目錄包括開放目錄、共用目錄和服務目錄。對資料開放來說,本身是有利的,更多的是政府和企業以及公眾之間共用層面的具體工作。資料資源希望流向社會,流向產業從而發揮更大的價值,而美國資料專案的初衷也是希望這些資料最終能流向產業,繁榮產業發展。因此,資料開放目前也是國家層面政府資訊建設的主要方向。
在政府資料開放中存在的問題主要有以下幾點:一是“不願開”,資訊資源被視為獨家壟斷資源,擔心開放後部門權力削弱、經濟利益受損,並可能暴露部門業務問題;二是“不敢開”,尚缺乏保障資料開放的配套制度,缺少具有可操作性的強制性規定,與政府資訊公開、保密法、檔案法等相關法律法規銜接不到位,各地對政府資料開放的範圍和潛在風險存在“後顧之憂”;三是“不能開”,資料基礎不牢,公共部門尚未建立一套完整的資料資源採集、管理、加工和開發利用的體系,很多資訊資源缺乏數位化,資料資源多頭採集、重複建設、成本高昂,很多資料無人維護、不可持續,資料的品質和準確性也存在問題,有哪些資料資源也不清楚;四是“不會開”,開放品質不高,可利用性差,網站資料的品質問題突出,包括可機讀性差、資料更新頻率不高、資料互動性差等,網站缺乏標準化,增加了使用者成本。這也是從技術視角來探討資料開放不得不克服的一些問題。
第三是資料共用。主要通過共用交換平臺來實現,但是傳統的資料共用交換體系在大資料時代面臨一些問題:首先,在政策制約方面,一是政府資料共用缺乏全國統籌機制,協同不足,二是政府共用資料時,保護部門利益的本位思想較重;其次,在基礎制約方面,一是資料交換共用機制問題導致資料不落地,難以滿足大資料時代對多維度數據的需求,二是缺乏中心交換的政府資料共用技術,沒有資料融合的統一平臺。政府大資料共用交換體系與大資料時代未來發展更多維的資料融合以及以人工智慧為基礎的智慧型政府應用之間存在一些矛盾。總結國內各級政府發佈的大資料政策中的重點任務要求,可以看到,開放平臺、共用平臺、目錄體系、基礎資料庫和管理中心是各級政府發展大資料的五項抓手。
各地方發展大資料的主要工作
第四是統籌彙聚。在資料中心層面,目前各地前期建設的很多資料中心在實體層是分離的,既擁有協力廠商資料中心、運營商資料中心,也有政府建設的資料中心,在區域級、行業級,根據不同的需求,歷史的資料中心都建設起來了。目前國家政策要求建設綠色、集約、節能、共用的資料中心,如何發揮大量的分散的資料中心的價值?需要實現各種資源整合共用利用,同時對新增的資料中心的管理要嚴格。關於資料中心建設,國家發改委也多次提出要統籌整合、共用利用已有的資源。在資訊平臺層面,要統籌利用已有的資源,各地發展大資料時要徹底地整合政府資料。各級政府擁有很多資訊平臺以及落地的政府專案,為實現融合貫通,需要採用一些技術手段來爬取一些資訊資源,建設智慧型的統一共用公共平臺。但是對於已建成的分散的資訊資源平臺,包括網站、資訊系統等,不可能再推翻重建,對於落地的政府級專案也不可能把歷史的系統都拋棄掉,一般採取的措施是打通既有的舊的平臺,抓取相關的平臺資源來進行融合貫通,需要考慮到很多具體的實現方案,是採用爬取手段還是與既有平臺進行互動等,在“互聯網+政務服務”檔中都有所提及。在資料資源層面,目前各地都在建設共用較多的基礎資料庫,但是承擔的部門差異是很大的。資料資源層面同樣存在很多割裂的現象,如何真正地推動資料共用融合,提高政府資料的品質,形成資產化管理?除了加強舊的系統,整合既有資料以外,還要提高資料治理,建立資料管理的技術手段和規則以及業務流程。此外,社會普遍在探討政府和產業界的資料融合建設問題,比如採集部分互聯網資料資源,與企業共用一些相關資料。同時,對於大型機構掌握的核心資料,探討從防壟斷的角度來打破資料壁壘,這也是資料資源整合方面非常重要的一點。
三、中國信通院開展的主要工作
在《“互聯網+政務服務”技術體系建設指南》中,技術層面提出深化大資料和雲計算等技術應用,大資料主要實現清洗比對、資料採擷和資料開放等,雲計算主要實現集約建設、共用利用等。政務資料資源的利用離不開以大資料和雲計算為代表的技術手段,政務資訊資原始目錄檔的落地實施也需要新的資訊技術支援。技術領域如何服務於政府,如何實現國家政策檔中提出的政務資料資源整合共用利用的目標,這是在研究層面需要探討的問題。我們希望進一步整理出目前面臨的實際問題,然後給出非常清晰的標準化的技術語言,讓各級政府部門來推動,在實際工作中作為參考。中國信通院開展的主要工作包括以下幾個方面:
一是技術應用白皮書。彙編各領域研究成果,集合業界經驗案例並對外發佈。
《政務大資料建設標準體系》主要內容
二是政府大資料建設標準體系。首先,在技術層面建設大資料,要在多個視角進行體現,研究下一步的資料獲取如何搭建目錄,資料爬蟲如何實現,如何滿足不同介面的需求;其次,在存儲和計算領域,要形成一個政府的資料化系統。資料量是否足夠大?技術要求是否足夠高?跨度或者傳統資料庫是否足夠?在這些層面,目前缺少一些明確的技術指標來作為參考;再次,在資料治理層面,我們在品質管制、評估、清洗方面提煉出一些技術標準來供大家作為參考;在資料分析層面,面向政府級的應用也比較複雜,我們希望能夠提煉出一些基礎性的資料分析參考模型以及面向大眾的、普適性的應用來作為導向標準;視覺化主要問題是影響決策,希望出臺一些指導性意見,更好地引入外部資料;這是資料服務需要討論的內容,希望在具體領域與業界專家共同探討服務政府、服務產業界的標準體系,為產業發展做貢獻。以上是中國信通院前期的研究內容。
關注“數邦客”微信帳號,回復“政務”即可下載完整版PPT。
本文來源:數邦客