電子政務數據治理與數據認責分析

時間:2022-09-22 09:22:35

導語:電子政務數據治理與數據認責分析一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

電子政務數據治理與數據認責分析

一、引言

各地大數據中心建立,實現了不同機構間的數據聚集,但各多源異構系統來的數據質量不一、管控與互操作難等就成為痛點與難點浮現出來。解決之道雖在數據治理,但面對不同機構、領域、業務與應用的差異,涉及一系列紛繁復雜的問題時,仍使許多大數據中心難找準切入點。江陰市大數據中心從實際出發,通過近一年的探索與實踐,以數據質量測評為切入點開展數據治理,取得了一些經驗,同時對密切相關的數據認責領域也有了一些初步的思考與認識。

二、江陰政務數據治理的難題

2017年,江陰作為江蘇省唯一的集成改革示范縣級市,市委、市政府提出了構建“1中心+3平臺”的智慧城市總體框架。“1中心”即“江陰市大數據中心建設項目”,并將數據共享和應用支撐列入集成改革重點項目。江陰市成立大數據管理專職機構,以綜合改革之力,聚系統集成之效,召開多次推進會議,截止2018年底,江陰市大數據中心已完成了對全市市委、政府部門(全覆蓋)、群眾團體、部分駐澄單位國資公司等機構信息資源目錄的多批次采集,累計梳理全市61個機構的信息資源,1205個數據集,2.69萬余個有效數據項;其中主要接入公安、人社、衛計、教育、環保、安監等61個單位632個數據集,1.25萬個數據項,總數據量達10.78億余條,對推動政務信息資源共享工作的制度化和規范化,實施網格化、政務服務、“最江陰”便民體系、精準救助、稅收征管等近20個領域提供數據支撐上發揮了作用。然而,電子政務數據“聚、通、用”的應用需求,使機構間數據質量不清、語義與格式不一致、業務支持乏力等問題凸顯出來。我們意識到:在當數據集聚到一定體量、數據源增多、面對日趨深入的服務和構建新業務之需時,必須進行數據治理。但大數據中心面對的是各機構、跨系統歸集的數據;它不像各機構一樣只關心具體的條線業務,而要面向全局對政務數據資源負責。因此,弄清大數據中心特殊的數據治理內涵,其范圍與邊界,切入點與后續延伸等問題,就是當下各地大數據中心面臨的一道緊迫的難題。

三、江陰大數據治理的思路

江陰市大數據中心從數據治理理念、治理架構、要素選擇、量化測評等方面進行了系統化的探索,并委托富有數據治理經驗的第三方參與測評,取得一定實效,具體如下:(1)明確數據治理理念“數據治理”是泊來詞,“治理”英文為“governance”含義為“統治、管理、治理、統治方式、管理方式”等。govern-ance與govern-ment(政府)一詞同根,可見,數據治理的本義是針對數據的行政與管理活動,政務數據治理就是對數據的統治、治理及對應措施,但其前提是要摸清數據家底、供需范圍與質量水平。(2)選擇數據治理體系大數據中心作為各機構的資源樞紐,要在多源多向、異形異構的資源環境中開始數據治理,是個復雜問題,為此,要依據權威系統架構來作為治理的內容依據。國際數據管理協會DAMAInternational給出的典型數據治理模式如圖1。圖1中左側為數據治理的主要內容,右側為數據治理的基本環境。結合大數據中心職能,將數據治理的系統內容分解如下:①數據架構管理---梳理與描述數據中心的數據供需與責任架構;②數據開發---數據中心面向新業務與新應用的數據分析、設計、實施、測試、部署、維護等工作;③數據操作管理---覆蓋數據采集、歸集、比對與清洗到數據刪除的作業與管理責任;④數據安全管理---確保政務應用各環節中,機構與公眾的數據保密性、公民交流、訪問和管理權限的控制等;⑤參考數據和主數據管理---管理政務系統中各機構元數據、實體數據、描述數據、代碼數據和關聯數據等的各種版本與升級;⑥數據倉庫和BI---在多功能應用環境下,實現智慧政務的資源呈現、多維報告和分析等;⑦數據質量管理---從全局出發,定義、梳理、監控和提高從不同機構、不同系統來源的數據資源的質量與責任;⑧元數據管理---對源于不同機構、系統與應用的元數據/數據元進行統一梳理、規范化處理、整合、組配與控制等;⑨文檔和內容管理---從語義、主題內容等方面管理各類業務表單、作業文本、報告及其他結構化與非結構化數據等。(3)確認數據治理范圍數據治理環境涉及以下因素,包括:①治理目標和原則---要定義數據治理中涉及的每項職能的愿景與戰略目標,各項具體目標,實施績效與基本原則;②治理活動---各項治理作業能細分為下級活動,并進一步分解為具體的任務和步驟,數據間的依賴關系,順序和流程,用例與場景,觸發事件等;③主要交付物---治理后的成果包括各類元數據/數據元,合成數據項,實體數據,分類代碼體系,輸入與輸出對象,乃至各項管理體系;④角色和職責---大數據中心,各職能機構,社會公眾與企業事業單位等在政務活動供需中運行、加工、控制與管理的多種職能,個體的角色,組織角色,業務與資源角色等;⑤實踐和方法---大數據中心及各職能機構在資源提供、加工與處理運行中均涉及深度不等的治理實踐,并有一些可共享與互操作的方法,具體涉及通用方法與可選方法等;⑥治理技術---數據治理涉及各類治理工具,如資源標準和加工規程,比對與清洗規則,質量控制與驗證規程等;⑦組織和文化---電子政務的運行不僅涉及技術,還有理念、體制、機制、管理、價值與態度等方面的問題。(4)找準數據治理的切入點圖1表明,數據治理是個領域寬廣、內涵深且要求高的“認知+資源+技術+管理”的綜合體系,對于剛成立不久且仍在資源歸集中的大數據中心,要想按此架構開展全面數據治理是不實現的。于是,我們本著先易后難、先局部后全面、先單一再復合的原則,從上述9項要素中首先選擇數據質量測評為治理切入點,以期了解當前聚集數據的質量,包括各機構提供的數據實用性、體量、重用性與資源貢獻率等;從中尋找薄弱環節,按跨系統數據整合,構建業務應用的角度出發,突破邊界,設計指標,摸清存量數據,探索增量全局性數據質量改進的治理方向。(5)數據質量測評實施方案①統一數據質量認識開展數據質量測評必先了解其內涵。依據ISO8402,質量是反映實體滿足明確或隱含需要能力的特性總和,而政務數據質量,一指其必須滿足規定或潛在的單一政府機構業務需求,二指其滿足“三融五跨”的數據共享、互操作與業務發展。②構建數據質量測評標準本次測評在《GB/T36344-2018信息技術數據質量評價指標》的基礎上,根據實際出發構建相應的指標體系(如圖2)。測評指標的定義與說明①完整性---依據《GB/T36344-2018信息技術數據質量評價指標》定義與專業標準比對。計算公式如下:完整性=數量完整性+橫向(某縣級市)完整性+縱向(某地級市)完整性②實用性---依據專業領域數據項去冗后的實用項,及對江陰大數據中心已歸集的各單位實體數據的共享交換情況進行分析。計算公式如下:實用性=數據項實用性+實體數據共享交換量數據項實用性=提供數據項總數-冗余數據項③冗余度---數據項冗余度的計算公式如下:冗余度=冗余數據項/提供數據項總數(含冗余)其中,冗余數據項=提供數據項總數(含冗余)-去冗數據項④貢獻度---資源貢獻度的計算公式如下:貢獻度=各單位提供數據項(含冗余)/全部單位提供數據項總數(含冗余)⑤公共數據元采用度---公共數據元參考《GB/T19488.2-2008電子政務數據元第2部分:公共數據元目錄》計算公式如下:公共數據元采用度=公共數據元總數(含冗余)/提供數據項總數(含冗余)。⑥規范性---依據《GB/T36344-2018信息技術數據質量評價指標》定義并與專業標準比對。對江陰大數據中心已歸集的各單位信息資源與其機構職能進行分析比對,以定性判斷計算得分,定量評判應以各單位實地調研結果為準。⑦時效性---依據《GB/T36344-2018信息技術數據質量評價指標》定義并與專業標準比對。按日、月、年、不定期等八類更新周期,進行分類計算。計算公式:TL=D/(Tn×C)其中TL=時效性;D=未變化總天數;Tn=更新周期(可變);C=信息資源個數。⑧空項率---反應江陰各單位在數據歸集過程中實體數據的缺失情況。計算公式:空項率=(空白數據項/數據項總數)×100%質量測評成果本次質量測評按照先數量,后質量;先數據架構,后單項數據;先數據項,后實體數據的原則,采用定量與定性結合、專項與關聯分析結合、現場觀察與后臺對標相結合等方法,按提供數據的規范性、完整性和實用性為核心,綜合考慮其與外部資源的共享性與組合性作質量測評分級。根據上述8項指標,通過對全市61個單位、632個數據集、12102個數據項、10.78億實體數據的實地梳理和測評,形成《全面數據質量測評等級評價表》,將評價結果分為極欠缺、不充分、基本充分、充分、充分且規范共5個等級。其中,充分且規范的單位有16個,占比26%。此域的數據將作為測試試點,進一步分析其質量。試點選取具有行業代表性的機構(如教育局),以及機構職能改革后變動較大的部門(如市場監督管理局)等開展數據治理。具體實施仍依標準進行:建立元數據指標庫對數據項進行其他指標的測評;對實體數據則采用抽樣比對、清洗、轉換、形成試點治理數據庫等。

四、數據認責問題

(1)問題的浮現數據質量測評使大數據中心對各機構提供數據的完整性、實用性、貢獻度、規范性等有了初步了解,隨后就要從數據資產管理角度,對各機構的數據責任與權力、貢獻與共享等進行評估,這就屬于數據認責范疇了。數據認責是從全局角度,對各機構的數據進行管理職責的分解與認定,明確彼此間的資源供需邊界及協作機制,以建立穩定規范的數據治理體系;如責任與邊界不清往往造成多頭管理或“三不管”的情況,直接影響政務服務的效率與績效。對于大數據中心,如不開展認責,則相關職責也就將由自己一肩承擔,很快就會感覺“帶不動”,舉步維艱。面對各渠道來的資源,如“數據含義是什么”“數據質量如何”“誰能提供權威數據”“哪些數據可歸并”等問題均無法肯定回答。這實際上是能力與責任的不對稱,需要針對“聚、通、用”對數據管理職責重新認定與分配。(2)數據認責內容數據管理覆蓋數據生存周期各環節,數據責任同樣對應存在于每一項數據管理和應用之中,應由各機構的數據提供者、業務認責方、操作認責方以及技術認責方等角色分擔。具體認責如下:①對政務數據提供者:主要負責制定數據管控政策,維護數據供應目錄并分配數據認責權限;②對業務主導方:主要負責明確數據定義,制定數據標準、質量規則、安全規則并監控相關數據問題,同時也是對應數據的責任主體;③對操作認責方:主要負責執行數據管理規則,錄入各項數據并解決相關數據問題;④對技術認責方,主要負責為數據管理提供技術支持,推動數據架構、標準和規則等內容的落地。(3)如何開展數據認責在數據質量測評的基礎上,我們將首先梳理認責數據項,即對哪些數據進行認責管理。政務數據歸集了成千上萬的數據項,對認責來說數量巨大,也意味著工作量巨大,不可能一蹴而就,需要分批次進行。同時,從電子政務效用出發,人們會對數據認責抱以價值期望。因此,在認責數據項的梳理和篩選上可采用“問題+價值”雙驅動的策略,即優先對問題多發且業務影響較大的數據項開展認責管理,通過責任落實改善提升數據質量,從而控制和解決問題,支撐業務發揮價值。為此,將通過數據治理建立一套數據問題的歸集、分析和管控機制,以及高業務價值核心數據項的識別方法。其次將梳理認責關系矩陣,即數據各項責任與機構、崗位、人員間的對應關系。而后,將相關數據責任落實到對應崗位人員的日常工作和數據操作中。數據責任的落實通??梢耘c數據質量整治工作結合進行,在明確崗位人員數據責任的同時,同步明確責任落實要求,例如數據錄入責任與數據項錄入規范的同步執行,通過規范錄入行為以及糾正錄入錯誤強化責任意識。

五、進一步數據治理的思考

本次數據治理雖取得了一定成果,但對圖1的9環節治理要素,畢竟目前只是從其中之一切入的。下一步仍不能全面展開,而要結合數據質量管理+數據認責形成雙輪驅動的治理機制。除大數據中心將統一建立與維護公共數據元池,對各單位的公用數據元與實體數據進行統一轉換映射,提升其標準化與質量水平外,還要開展相應的認責機制建設。具體思路是:①定角色,劃職責;②建機制,定規范;③構建數據責任管理網絡;④推進相應的組織與文化變革等。綜之,數據治理項目不單單是搭建一個集團級的平臺,而是一項長期而復雜的工程,涉及到數據管理體系、數據標準、數據治理、數據質量和認責、相關系統升級改造、數據清洗等多個方面。項目建設依據快速見效、急用先建的思路,先整體規劃,以數據模型和數據標準為基礎,以數據治理管理平臺為載體,并開展數據治理專項工作,確保數據治理項目的成功,為實現有效的數據資源整合夯實基礎。

作者:金海峰 董菊香 李春香 單位:江陰市大數據中心