(資料圖片僅供參考)
數(shù)據(jù)標(biāo)準(zhǔn)是數(shù)據(jù)治理體系中的核心要素之一。
一方面,統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)可以在復(fù)雜的業(yè)務(wù)場(chǎng)景下,幫助團(tuán)隊(duì)對(duì)齊數(shù)據(jù)口徑,提升數(shù)據(jù)在分析、診斷等場(chǎng)景的質(zhì)量與效率;另一方面,數(shù)倉(cāng)團(tuán)隊(duì)與分析師團(tuán)隊(duì)也需要沉淀一套敏捷、可控的數(shù)據(jù)標(biāo)準(zhǔn)指標(biāo)管理流程,以便后續(xù)在指標(biāo)口徑的增加、修改、下線等方向更標(biāo)準(zhǔn)、高效。
但數(shù)據(jù)標(biāo)準(zhǔn)建設(shè)并不是一個(gè)簡(jiǎn)單的過(guò)程。在同一個(gè)企業(yè)內(nèi)部,也存在對(duì)標(biāo)準(zhǔn)認(rèn)知不一致的問(wèn)題。以銀行業(yè)舉例,對(duì)于“客戶”的定義,客戶部認(rèn)為“辦了銀行的卡的人即為客戶”,而網(wǎng)銀部則認(rèn)為“銀行網(wǎng)站注冊(cè)過(guò)、或者通過(guò)銀行轉(zhuǎn)賬的人都屬于客戶”,這即是對(duì)同一個(gè)概念存在認(rèn)知偏差。
另外,在實(shí)際數(shù)據(jù)開(kāi)發(fā)過(guò)程中,也存在開(kāi)發(fā)人員對(duì)同一個(gè)字段采用不同的命名,或者存在同義不同名的元數(shù)據(jù)字段,導(dǎo)致溝通成本增加,甚至最終影響數(shù)據(jù)質(zhì)量。
近期,火山引擎大數(shù)據(jù)治理研發(fā)套件DataLeap上線的「數(shù)據(jù)標(biāo)準(zhǔn)」模塊瞄準(zhǔn)這一問(wèn)題,希望為數(shù)據(jù)從業(yè)提供一套數(shù)據(jù)標(biāo)準(zhǔn)的管理能力。
據(jù)介紹,該模塊已提供數(shù)據(jù)標(biāo)準(zhǔn)、標(biāo)準(zhǔn)代碼、命名詞典管理的功能,還支持對(duì)各類(lèi)數(shù)據(jù)源的庫(kù)表進(jìn)行掃描,并進(jìn)行智能推薦對(duì)標(biāo)。對(duì)于企業(yè)整體的數(shù)據(jù)標(biāo)準(zhǔn)情況,DataLeap則提供可視化的統(tǒng)計(jì)大盤(pán),幫助數(shù)據(jù)團(tuán)隊(duì)快速了解標(biāo)準(zhǔn)的新建情況和使用情況。
在使用場(chǎng)景上,用戶基于DataLeap完成統(tǒng)一數(shù)據(jù)標(biāo)準(zhǔn)建設(shè),消除數(shù)據(jù)不一致性,推動(dòng)數(shù)倉(cāng)規(guī)范數(shù)據(jù)建設(shè),還可以與指標(biāo)服務(wù)打通,對(duì)接數(shù)據(jù)地圖資產(chǎn),進(jìn)一步達(dá)到數(shù)據(jù)治理的目的。
除了數(shù)據(jù)標(biāo)準(zhǔn)管理之外,火山引擎DataLeap還提供數(shù)據(jù)集成、開(kāi)發(fā)、運(yùn)維、治理、資產(chǎn)、安全等能力,幫助用戶提升數(shù)據(jù)研發(fā)效率、降低管理成本,加速推動(dòng)企業(yè)的數(shù)字化轉(zhuǎn)型,目前已經(jīng)應(yīng)用于泛互聯(lián)網(wǎng)、制造、新零售、汽車(chē)等領(lǐng)域。(作者:何澤)