行業資訊  /  News

首頁 行業資訊

中國移動江勇:提升數據治理效能,數據全生命周期管理扛大旗

發布日期:2022-09-14 09:24:38  瀏覽次數:3924 來源:通信世界

數據全生命周期管理依據不同數據在不同階段的價值,實施不同的管理策略,用于管理數據在整個生命周期內的流動,根據價值適配存儲資源。日前,中國移動信息技術中心大數據平臺部副總經理江勇在專訪時表示,中國移動結合梧桐大數據平臺及應用情況,提出了按照數據域的劃分來對數據實施分集群管理的策略,通過科學的管理維護數據全生命周期,深化運維體系改革,降低數據運維成本,提高數據使用率,推進運維智能化轉型;在安全合規的前提下,強化數據賦能管理,推進數據資源依法向資產、資本轉變。

建立數據全生命周期管理規范 實行分級存儲管理

中國移動在依法合規匯聚、融合全域數據的過程中,積累了越來越龐大的數據,這是數字經濟時代的“新石油”。作為數字中國、智慧社會建設的主力軍,如何更加科學有效地管理和使用數據,利用現有資源實現數據資產價值的最大化,賦能企業和社會數智化轉型,對于中國移動來說是一個非常重要的課題。

數據全生命周期管理,是中國移動數據治理的核心領域之一。據悉,中國移動建立了一套完整的數據標準管理體系——數據全生命周期管理規范,該管理規范提出了數據全生命周期管理的中長期規劃,通過對數據進行冷熱溫劃分,依托不同性能、不同成本的存儲介質,結合東數西算戰略布局,來實現數據的分類分級存儲管理。冷熱溫劃分的目的,在于控制成本,優化資源配置。冷熱溫的劃分依據主要是數據的訪問頻次,數據的熱度標簽之間可進行動態轉換。通常情況下,熱數據需要具備較好的硬件配置,比如高性能CPU、SSD固態硬盤等;冷溫數據可采用中低成本、中性能的介質存儲,比如HDD機械硬盤、磁帶、光盤等。

同時,梧桐大數據平臺依據現階段具備的技術條件,制定適配各集群的存儲周期管理方案,包括各集群的存儲周期管理矩陣、數據清理機制及清理策略、數據容災恢復機制、數據全生命周期流程管理等。此外,基于“通用+定制”原則,建立個性化存儲需求的評審管控機制,不適配實際生產的特殊數據可進行存儲周期的個性化定制,并對其成本和收益進行評估反饋,輔助管理者進行評審管控以及后續全生命周期管理方案的迭代優化。

在數據的全生命周期管理過程中,不同階段的數據,對于其查詢使用性能、存儲周期的要求不同。那么,中國移動梧桐大數據平臺如何對這些不同階段的數據進行管理?

據江勇介紹,梧桐大數據平臺對依法合規匯聚的數據,打造了橫向分層+縱向分域的數據管理體系。

數據橫向分層,旨在實現清晰掌控數據結構及其流向,滿足不同場景的數據使用需求。數據分層架構的價值在于:一是各層級規范化、作用域明確,數據使用更易定位;二是復雜問題拆解為多個步驟逐層加工,各層處理特定問題,簡化邏輯方便維護;三是分層數據血緣清晰,通過上下游信息,快速準確定位問題并梳理影響范圍;四是數據逐層加工,共有邏輯沉淀至中間層,減少重復計算和數據冗余,降低企業的存儲和計算成本;五是分層實現業務邏輯拆解解耦,屏蔽上層應用對源業務變化的感知,降低依賴,提高數據的健壯性及迭代效率。

數據縱向分域,是站在業務系統、分析對象、部門等角度對數據進行細分、歸納,抽象出主題,企業最終圍繞主題域進行數據建設。

梧桐大數據平臺的數據架構體系,自下而上是:基礎數據層、輕度匯總層、融合視圖層、業務應用層。

基礎數據層存儲清洗后的貼源數據,數據結構與源端系統基本保持一致,數據顆粒度最細,信息量最大,但數據處理成本高,數據應用使用效率低。

匯總層存儲分主題分維度的輕度聚合數據,以需求應用為建模驅動,做較細粒度的降維處理,數據存儲量相較基礎層有所降低,數據使用效率提升,可靈活支撐運營分析場景。

融合視圖層存儲重度聚合的統一業務視圖數據,可跨域融合建設。

業務應用層存儲需求和應用所需的查詢展示數據,一般為報表指標級數據。

梧桐大數據平臺的數據,在依法合規逐層加工萃取的過程中,資產價值度逐層遞增,存儲規模逐層遞減,存儲周期逐層擴展。

除了對各階段數據設定不同的存儲周期外,也會采取不同的管理手段。比如:逐層加強對數據的監控稽核,提升數據質量;加大對高價值萃取后模型的依法合規開放共享,提升數據復用度,助力數據資產價值轉化;加強對底層數據的多維數據建設及治理,從源頭提升整體數據體系的質量及復用度。

BOMS域數據深度融合 打造縱深橫闊的數據資產體系

梧桐大數據平臺持續依法合規匯聚BOMS四域數據,BOMS分別是運營商的業務域、網絡域、管理域、增值域。

中國移動打造建設了豐富的BOMS垂類模型體系,因各域數據特性及服務場景的不同,模型的構建思路存在差異。

BMS三域模型,站在逐層加工萃取的角度,構建的模型主要分為2類:

1.垂類主題模型:即按照主題或業務劃分,基于使用需求場景,逐層聚合匯總,形成特定主題或業務的數據模型。

2.橫向融合模型:即融合同一主體在不同業務域的數據,依法打造全方位的主體畫像模型。

O域通過解析沉淀豐富的維度標簽體系,比如行業庫、關鍵詞庫、APP庫等,解析可擴增數據內容,拓寬服務場景,提升數據服務能力。數據自下而上逐層匯聚收斂,O域模型主要包括2類:

1.行業模型:即對主體進行分行業分場景的行為數據匯總。

2.大眾模型:即不分行業的群體上網行為數據。

B域和O域模型的構建手段基本類似,其差異體現在:

B域是基礎底座,其橫向豐富的業務數據可支撐各類場景,而O域數據在探索的精準性和縱深粒度上更有優勢。

O域相比B域,數據存儲體量較大,在模型的構建上降維粒度更大。

除具備豐富的BOMS垂類模型體系,中國移動也在建設跨域融合資產體系,通過各域的深度融合,構建產品等多維成本分析和價值評估模型,逐步打造縱深橫闊的高階數據資產體系,在安全合規的前提下支撐服務各行業的數智化轉型。

賦能企業數字化轉型 5G數據實踐應用成效顯著

隨著新一代信息技術與制造業的深度融合發展,全球工業數據應用已經進入縱深發展的新階段,數據作為新型生產要素和重要戰略資源,正在制造業數字化轉型過程中發揮出更大的作用。在這一進程中,工業數據的依法流通共享受到廣泛關注。

CHBN四輪全向發力,融合融通協同發展,因第五代移動通信技術將實現產業互聯,5G數據呈爆發式增長和快節奏發展。中國移動重點推進5G數據在工業互聯網、車聯網、智慧物流、智慧港口、智慧采礦、智慧電力、智慧油氣、智慧農業和智慧水利等領域的深度應用,加快重點行業的數字化轉型進程。

在5G數據的全生命周期管理實踐中,通過熱度算法(數據訪問頻次),實現了5G數據的冷熱溫分級管理。熱溫數據,加大對外開放力度、加強質量監控、配備冗余備災方案等手段,實現資產價值最大化;冷數據,定期預警,開展系列數據治理舉措,促進數據從冷到溫熱狀態的良性轉化,并對低價值數據開展清理工作,提質降本兩手抓。

在5G數據持續匯聚、逐層萃取的過程中,持續推動高價值數據能力上智慧中臺,依法合規面向全網開放共享,賦能行業創新,推進大數據和各產業的深度融合,加速數據要素價值轉化。截至今年7月,5G開放數據已累計訂購4398次,梧桐大數據為688家企業、高校等單位提供了數據服務,數據實踐應用成效顯著。

數據安全貫穿數據全生命周期管理的全流程

大數據是“新基建”的核心和靈魂,數據濫用、數據盜竊、數據越權使用、數據泄露等數據安全問題都會影響到發展“新基建”的效果。那么,數據安全管理該如何貫穿數據全生命周期管理過程?

梧桐大數據平臺嚴格落實“四法一條例”要求,打造了堅實的基礎安全能力,包括系統安全防護(對所有應用系統做相應的防火墻配置、漏洞掃描、滲透測試、代碼審計等系統防護措施)、4A管控(所有生產域和測試域的設備均需要納入4A管控)、賬號口令及認證授權管理(重點防范弱口令、未授權訪問等)、金庫管控(敏感操作觸發審批模式)、敏感數據防泄漏(DLP等設備)、日志管理與審核等。

梧桐大數據平臺在安全合規的前提下拓展數據產品服務,堅持“三不原則”(數據無授權不共享、原始數據不出系統、系統不出移動),將安全管理策略、制度、流程與安全管理技術同步推進,建立從數據收集、數據存儲、數據加工、數據開放共享、數據傳輸、數據應用、數據流通、數據到期清理的全生命周期的數據安全管理體系。

數據全生命周期管理的全流程,安全始終貫穿其中。梧桐大數據平臺采取的安全管控手段如下:

數據收集階段:敏感數據識別審核管控 + 加密網絡通道收集。

數據存儲階段:保密協議簽訂+生產系統均4A接入+敏感數據加密存儲+數據備份恢復機制。

數據開發及查詢階段:敏感數據加密存儲+敏感數據查詢金庫觸發+實名制賬號水印標記+圖形堡壘嚴控數據下載+操作日志留存審計。

數據傳輸階段:嚴審網絡策略+文件及數據加密傳輸+內部加密網絡通道+傳輸日志留存審計。

數據共享階段:敏感數據安全審核+4級敏感數據嚴控不開放。

梧桐大數據平臺嚴格按照安全管理要求,對數據管理的各環節,接入日志并進行日志常規審計,確保各類行為“可溯”。

在數據全生命周期管理的過程中,梧桐大數據平臺以數據可視化為手段,推動技術、業務和數據的融合,將已有的資產存儲量、資產分布、資產萃取流向、無效數據清理成效、不同類數據的存儲策略分布等動態,用大屏進行集中可視展現,為數據管理、風險防控、調度決策提供參考依據。

除此之外,在對外服務重點行業的過程中,中國移動打造了基于隱私計算技術的更安全的一站式對外生態平臺,推進千行百業“用數賦智”。

隱私計算是面向隱私保護的計算系統和技術,涵蓋數據的產生、存儲、計算、應用、銷毀等信息全流程。中國移動自主設計的1+X架構的隱私計算平臺,解決了異構平臺間數據互通的難題,大幅節省時間、人力及物理資源的成本,大量級數據交互的計算效率相比同類型產品高出50%以上,處于行業領先水平。隱私計算基于多方安全計算、聯邦學習等技術,實現了“原始數據可用不可見”、“無敏感數據流通”、“數據不落地”,滿足國家數據安全保護法律法規的監管要求,因其具備多種MPC算子、機器學習算法,滿足風控、營銷、運營等多類細分場景與應用方向的需求。

綜上,梧桐大數據平臺的數據全生命周期管理,嚴格遵循安全管理要求執行,有效保護信息安全的前提下,充分發揮數據資產價值。

肩負“鏈長”責任 著力提升數據治理效能

前不久,中國移動在“2022科技周暨移動信息產業鏈創新大會”主論壇上首次提出要做通信產業鏈的鏈長。在江勇看來,“做通信產業鏈的鏈長”是一種新的產業鏈治理機制,中國移動需發揮協同和示范作用,在強大自身的同時,帶動產業鏈發展,牽引各企業“補短”、“鍛長”,助力通信產業生態愈加完善。

當前,數據作為數字經濟時代的關鍵生產要素,在大數據技術迭代、數據融合、行業拓展等多方面不斷升級,數據要素的生產規模化、價值效能提升等需求激增。同時多方參與、環節增加所帶來的長流程,以及行業應用對數據服務時效性要求的不斷提高,給數據治理工作帶來了挑戰,例如多類業務數據管理復雜、數據不易精準定位等。

數據全生命周期管理是數據治理領域的核心模塊之一,結合內外部環境變化的生態形式,為應對上述挑戰,江勇表示將從以下方面提高數據治理效能:

1. 建立健全線上數據全生命周期自動化配置、數據自動清理、容災備份機制及流程管理規范,推動大數據生產運維管理的線上化、自動化、智能化建設,不斷加強企業級數據管理能力。

2. 建立數據熱度分級管理標準,根據數據特性打造適配各域各類別的冷熱溫分級管理方案,包括配備不同存儲介質、分級設定存儲周期、不同副本存儲、配置不同壓縮格式等,實現冷熱分級降本提效。

3. 提前統籌規劃圍繞東數西算的戰略布局,優化數據中心建設布局,合理配置資源。通過建立東數西算的數據適配評估矩陣,對不同類別數據的實時性要求、查詢性能、計算要求、業務使用場景等進行多維分析,提前規劃適合西遷的數據,同時,依據算力類型,規劃不同的東數西算場景。通過東數西算戰略布局,全力推進新基建,助力數字經濟綠色蓬勃發展。

4. 中國移動以DCMM《數據管理能力成熟度評估模型》(Data Management Capability Maturity Assessment Model)為標準為指導,持續構建全網大數據治理體系,以“構建管理制度,強化管理標準,優化管理流程,提升開放服務質量”為目標,推進全網數據治理體系和治理能力的提升,促進中國移動大數據價值發揮,完善數據質量保障機制,確保數據全鏈路安全,推動數據資產可見可用易用好用,加速數智化轉型。日前,工業和信息化部公示了2022年大數據產業發展試點示范項目的項目名單,中國移動申報的“構建以智能元數據為引擎的數據治理平臺”項目成功進入試點示范項目名單。同時,中國移動作為通信行業首家集團單位,已取得國家標準DCMM量化管理級4級認證。現階段梧桐大數據平臺已在全網數據統一資產目錄管理、數據全生命周期管理、數據質量管理、數據標準管理、數據安全管理、全網元數據納管等方面開展全方位的數據治理工作,并通過建章立制、工具適配打造、監管監控、實施執行與落地,不斷迭代完善治理體系。

5. 組織全網大數據全生命周期管理規范編制,邀請各單位專家分享先進管理經驗,共同探討疑難雜癥的解決方案,通過協作共建,汲取先進經驗,打造標準化一體化的工具,推動各單位數據全生命周期管理能力拉齊,全網數據治理一盤棋,形成長效管理機制。

6. 長期積累和總結中國移動數據全生命周期管理的經驗,提煉對外輸出的治理能力,將其納入有中國移動大數據特色的方法論和咨詢產品目錄,以大數據管理咨詢服務的形式依法合規對外輸出,賦能行業數智化轉型。梧桐大數據平臺現已在交通運輸行業實現了數據管理賦能咨詢服務,成功為企業打造適用企業特點的數據管理能力體系,賦能企業數智化發展。

上一篇: 網信辦就《關于修改〈中華人民共和國網絡安全法〉的決定(征求意見稿)》公開征求意見

下一篇:寧夏推動數據中心和5G等新型基礎設施綠色高質量發展

業務
咨詢

客服熱線

客服
熱線

7*24小時服務熱線

18986158343
7*24小時服務熱線

關注微信

關注
微信

微信二維碼 關注官方微信
返回頂部 頂部