本文版權(quán)為《郵電設(shè)計技術(shù)》所有,如需轉(zhuǎn)載請聯(lián)系《郵電設(shè)計技術(shù)》編輯部
摘 要:現(xiàn)有數(shù)據(jù)管理技術(shù)難以解決跨域數(shù)據(jù)共享流通面臨的跨域異質(zhì)數(shù)據(jù)語義難統(tǒng)一、跨域共享流通隱私難保護(hù)、跨域數(shù)據(jù)查詢性能難優(yōu)化等問題,嚴(yán)重制約了數(shù)據(jù)共享流通的高效性。因此,跨域數(shù)據(jù)管理近年來受到了學(xué)術(shù)界和工業(yè)界的關(guān)注。介紹了跨域數(shù)據(jù)管理的基本概念與關(guān)鍵技術(shù)挑戰(zhàn),回顧了現(xiàn)有與跨域數(shù)據(jù)管理相關(guān)的研究,最后討論了跨域數(shù)據(jù)管理的一些重要研究問題。
關(guān)鍵詞:數(shù)據(jù)管理;跨域共享;數(shù)據(jù)流通
doi:10.12045/j.issn.1007-3043.2025.05.007
引言
數(shù)據(jù)是數(shù)字時代的關(guān)鍵生產(chǎn)要素,具有倍增效應(yīng)、疊加效應(yīng),能夠賦值、賦能社會經(jīng)濟(jì)發(fā)展全過程,驅(qū)動社會經(jīng)濟(jì)數(shù)字化轉(zhuǎn)型、網(wǎng)絡(luò)化重構(gòu)和智能化提升。圍繞數(shù)據(jù)價值的發(fā)揮,加快前沿數(shù)據(jù)技術(shù)融合和技術(shù)突破,有效支撐數(shù)據(jù)要素共享流通與價值釋放,既是《關(guān)于構(gòu)建數(shù)據(jù)基礎(chǔ)制度更好發(fā)揮數(shù)據(jù)要素作用的意見》、《數(shù)字中國建設(shè)整體布局規(guī)劃》等一系列國家層面戰(zhàn)略規(guī)劃共同關(guān)注的重點,也是培育數(shù)據(jù)要素市場和產(chǎn)業(yè)生態(tài)構(gòu)建的迫切需求。
為了有效支撐這一系列國家層面的制度實踐,培育數(shù)據(jù)要素高效共享流通的技術(shù)體系和產(chǎn)業(yè)生態(tài)十分迫切。以北京為例,圍繞“數(shù)字經(jīng)濟(jì)國際標(biāo)桿城市”和“數(shù)據(jù)基礎(chǔ)制度先行區(qū)”建設(shè),形成京津冀、長三角、粵港澳之間超大城市群的聯(lián)動,亟需解決數(shù)據(jù)在城市治理復(fù)雜場景的共享流通與有效利用,從而以高質(zhì)量的數(shù)據(jù)價值釋放支撐高質(zhì)量的經(jīng)濟(jì)社會發(fā)展。然而,隨著數(shù)據(jù)要素共享流通規(guī)模的不斷擴(kuò)大和應(yīng)用范圍的不斷擴(kuò)展,越來越多的場景面臨著因“跨域”而帶來的數(shù)據(jù)管理難題。具體而言,在城市治理等復(fù)雜場景中,數(shù)據(jù)共享流通呈現(xiàn)出跨部門、跨層級、跨主體等顯著的“跨域”特征,使數(shù)據(jù)管理的復(fù)雜度大大提升,同時面臨嚴(yán)峻的高效性挑戰(zhàn),這對數(shù)據(jù)管理技術(shù)提出了新的要求。
為了有效應(yīng)對數(shù)據(jù)跨域共享流通中的高效性挑戰(zhàn),跨域數(shù)據(jù)管理近年來受到了學(xué)術(shù)界和工業(yè)界的關(guān)注。傳統(tǒng)的以數(shù)據(jù)庫管理系統(tǒng)為代表的數(shù)據(jù)管理技術(shù)主要關(guān)注單一企業(yè)、部門等單域場景,側(cè)重于對域內(nèi)數(shù)據(jù)進(jìn)行存儲、查詢和分析。而跨域數(shù)據(jù)管理是指對分散于不同域(部門、層級等)的數(shù)據(jù)進(jìn)行統(tǒng)一的管理,實現(xiàn)數(shù)據(jù)在不同域間進(jìn)行高效且安全的共享流通,并為不同的應(yīng)用場景提供統(tǒng)一的查詢方式。
為了更好地對跨域數(shù)據(jù)管理進(jìn)行說明,這里以某市金融數(shù)據(jù)專區(qū)為例(見圖1),這是某市大數(shù)據(jù)中心建設(shè)的全國首個公共數(shù)據(jù)專區(qū),為多家金融機(jī)構(gòu)提供數(shù)據(jù)服務(wù),亟需解決個人/企業(yè)的大規(guī)模數(shù)據(jù)跨越公安、稅收、民政等30多個部門高效共享流通問題。這里面存在一系列制約高效性的跨域數(shù)據(jù)管理問題。
圖1 某市金融數(shù)據(jù)專區(qū)跨域數(shù)據(jù)管理示意
首先在供給側(cè),也就是跨域數(shù)據(jù)層面,需要融合社保、稅收等多個數(shù)據(jù)項,這些數(shù)據(jù)源分散在多個部門的多個數(shù)據(jù)源中,存在大量異質(zhì)數(shù)據(jù)模式,存在大量同名不同義、同義不同名問題,因此語義理解難,數(shù)據(jù)找不準(zhǔn)。其次在供需間,也就是跨域流通層面,金融專區(qū)大量的數(shù)據(jù)是隱私敏感數(shù)據(jù),跨越多個部門流通。數(shù)據(jù)流經(jīng)不同域時的訪問權(quán)限和隱私保護(hù)要求千差萬別:有些可以公開訪問,有些需要經(jīng)過差分隱私,有些則需要通過多方安全計算。因此跨域協(xié)同保護(hù)慢,數(shù)據(jù)流通不暢。最后在需求側(cè),專區(qū)通過查詢的方式提供服務(wù),需要支持日均十萬級調(diào)用、毫秒級響應(yīng)需求。但數(shù)據(jù)來自政務(wù)云、教育云等領(lǐng)域的私有云等資源異構(gòu)的底層數(shù)據(jù)管理系統(tǒng),它們的軟硬件環(huán)境不一,給數(shù)據(jù)的實時查詢帶來挑戰(zhàn)。