日韩精品无码视频一区二区蜜桃-日日噜噜夜夜狠狠久久丁香五月-毛片免费视频肛交颜射免费视频-美女视频一区二区三区在线-日韩 亚洲 制服 欧美 综合-亚洲国产精品500在线观看-亚洲精品国产一区二区在线观看-日韩亚洲在线一区二区-国产在线精品一区二区三区直播

數(shù)據(jù)資產價值實現(xiàn)(四)| 企業(yè)數(shù)據(jù)集成驅動價值最大化
熱點聚焦
2025.06.24

導語:


隨著越來越多的企業(yè)認識到數(shù)據(jù)作為生產要素的價值,加快了企業(yè)數(shù)字化轉型,把完善企業(yè)級的數(shù)據(jù)治理體系作為企業(yè)數(shù)字化轉型的一個目標。長亮科技在大數(shù)據(jù)領域始終保持足夠的技術敏銳度,并積累了豐富的經驗與資產。為此,我們組織了一個系列專文,分期發(fā)表,與您一起探索更適合當下行業(yè)發(fā)展的數(shù)據(jù)觀,歡迎大家持續(xù)關注。



作者|長亮科技大數(shù)據(jù)研究院

內容|本篇共3960字,預計閱讀時間18分鐘



數(shù)據(jù)是組織的戰(zhàn)略資產,組織應該清楚地了解“數(shù)據(jù)的戰(zhàn)略價值”以及如何釋放和利用數(shù)據(jù)來產生積極的業(yè)務影響。定義數(shù)據(jù)戰(zhàn)略的起點首先是了解如何以一種經過深思熟慮、可重復、敏捷的方式使用數(shù)據(jù)來滿足企業(yè)內外各種需求,從集成主數(shù)據(jù)開始,部署可重用的高質量數(shù)據(jù),最終實現(xiàn)企業(yè)級的集成語義層。



01 

需求驅動與業(yè)務驅動


l 需求驅動


許多組織習慣性地將需求驅動軟件開發(fā)的傳統(tǒng)方法應用于數(shù)據(jù)平臺類系統(tǒng)建設中,數(shù)據(jù)服務部門按照業(yè)務部門的需求進行設計、開發(fā)提供數(shù)據(jù)服務。數(shù)據(jù)服務部門日常窮于應付業(yè)務部門用戶需求,還要面對需求部門的抱怨,同時承受用戶對數(shù)據(jù)的正確性、一致性以及時效性不滿意。由于需求的分析結果不能交互共享,難以在組織內獲得并充分利用數(shù)據(jù)的全部價值,不能消除企業(yè)層面的內部障礙。他們日復一日重復開發(fā)了數(shù)以萬計的表,知道自己一直在重復設計和分發(fā)相似的可能不正確或沖突的數(shù)據(jù),服務于特定目的需求功能,而很少關注數(shù)據(jù)本身,持續(xù)創(chuàng)建孤島。


基于孤立的、局部的數(shù)據(jù),只能產生業(yè)務特定的狹隘認知,缺乏支撐業(yè)務快速行動所需的黏合力、統(tǒng)一性與敏捷性,很難洞察出更多的業(yè)務價值,難以滿足業(yè)務發(fā)展與競爭需要。局部范圍的數(shù)據(jù)質量問題往往也難以及時發(fā)現(xiàn),可能產生不良后果,如誤導客戶營銷,增加風險,導致合規(guī)成本飆升等等,投入巨資重復建設而獲得的價值很小。


l 數(shù)據(jù)驅動


設計良好的軟件解決方案可以利用封裝的可重用功能組件,獲得可靠的質量保證,同時避免了重復開發(fā)帶來的各種成本與不確定性。


數(shù)據(jù)價值不在于預定義的處理功能,而在于數(shù)據(jù)本身。以數(shù)據(jù)為中心是一種靈活的企業(yè)數(shù)據(jù)架構,在數(shù)據(jù)分析生態(tài)環(huán)境中部署可重用的高質量數(shù)據(jù):采集最廣泛來源的數(shù)據(jù),按照統(tǒng)一的規(guī)范清洗與轉換數(shù)據(jù),清理冗余數(shù)據(jù),提升數(shù)據(jù)的準確性、一致性與完整性等內在價值,形成反映企業(yè)完整的數(shù)據(jù)單一視圖。然后基于統(tǒng)一的數(shù)據(jù)創(chuàng)建不同視圖重用于多種目的,并確保需要它的每個人都可以訪問它,將分析轉移到數(shù)據(jù)中,而不是相反地——為每個需求復制數(shù)據(jù)。


在數(shù)據(jù)驅動的背景下,可以有效管理數(shù)據(jù)需求,新需求首先考慮如何從已搭建的集成數(shù)據(jù)環(huán)境中尋找是否有可重用的數(shù)據(jù)資產——獲得 “免費午餐”,不需要從頭開始,因而可以顯著降低開發(fā)和維護成本,減少尋找數(shù)據(jù)的時間,快速部署響應市場變化和各種需求。


l 數(shù)據(jù)集成驅動業(yè)務價值


數(shù)據(jù)能夠回答多少業(yè)務問題,取決于數(shù)據(jù)能產生多少有意義的組合。冗余數(shù)據(jù)與垃圾數(shù)據(jù)將使可能的組合發(fā)散,有價值的數(shù)據(jù)被淹沒在垃圾海洋中,不能產生更多的有價值的信息,使數(shù)據(jù)問題擴散,使用戶迷惑。數(shù)據(jù)集市的需求是確定的,因而數(shù)據(jù)是確定的,所能產生的組合也是確定的。


與分散的數(shù)據(jù)集市環(huán)境存在顯著不同,在企業(yè)集成數(shù)據(jù)環(huán)境中可以回答的跨領域的業(yè)務問題,隨著集成數(shù)據(jù)領域的增加,能回答的問題呈指數(shù)級增長,這是回答新問題、產生新價值的來源。


圖1:數(shù)據(jù)能夠回答多少業(yè)務問題,取決于數(shù)據(jù)能產生多少有效組合


比爾·恩門認為數(shù)據(jù)的集成是數(shù)據(jù)倉庫的第一真相。公司越大,這一點就越真實。數(shù)據(jù)集成是數(shù)據(jù)倉庫建設的核心內容,需要深入調研數(shù)據(jù)現(xiàn)狀,排除垃圾與冗余數(shù)據(jù),定義與分類數(shù)據(jù),建立數(shù)據(jù)之間關系。這些工作需要具備專業(yè)能力與持久韌性,一些供應商和顧問們忽視甚至排斥集成,但是在數(shù)據(jù)倉庫之外沒有其他方法可以進行集成,也沒有捷徑。


DAMA 等專業(yè)組織把數(shù)據(jù)集成與數(shù)據(jù)架構分別作為獨立的職能。如果把數(shù)據(jù)集成作為數(shù)據(jù)架構的一部分,表面上似乎降低了對數(shù)據(jù)管理相關領域的理解難度與復雜度,但也降低了數(shù)據(jù)集成的重要性,忽視了數(shù)據(jù)架構、數(shù)據(jù)集成、應用架構之間的關系。



02

高質量的數(shù)據(jù)資產

來自于高度的數(shù)據(jù)集成


彼得·德魯克說過,效率致力于正確地做事,效果則是做正確的事。 在數(shù)據(jù)倉庫20多年的發(fā)展過程中,不同供應商與用戶角色專業(yè)人員對數(shù)據(jù)集成的理解與認識存在很大差異,大多停留在表面的粗淺理解中,或故意忽略或回避“數(shù)據(jù)集成”的本質,既不能正確地做事,也不能做正確的事,數(shù)據(jù)集成的成熟度沒有得到質的提升。


代表高質量數(shù)據(jù)的完整性來自數(shù)據(jù)的高度集成。中文語境下的“整合”概念,并不能覆蓋英文語境“集成”概念的豐富內涵。英文語境中集成與完整性詞根相同,可以說數(shù)據(jù)集成的本質目標是實現(xiàn)數(shù)據(jù)的完整性,有清晰的標準要求。把多個數(shù)據(jù)源以通用格式存儲到數(shù)據(jù)湖中,然后轉換為目標物理模型結構的數(shù)據(jù),存儲在相同的數(shù)據(jù)模型中,還不是完整的數(shù)據(jù)集成。


數(shù)據(jù)集成在邏輯數(shù)據(jù)建模過程中需要開展以下設計工作:


l 檢查每個邏輯實體的定義、語義用途和范圍,以查找可能的業(yè)務實體重復項,這些實體可能以不同的名稱為人所知


l 識別出相對概念,進一步確保邏輯實體的唯一性。如客戶是一個相對概念,某個組織 (第一性概念)買了銀行的產品或服務成了銀行的客戶,這個組織同時也可能是銀行的合作伙伴、供應商或交易對手,要識別出這些角色背后的唯一的本質實體


l 確保每個實體實例都有一個且只有一個唯一的標識符,即使在舊實例生命周期結束并從數(shù)據(jù)庫中刪除后,也永遠不會將其重新分配給新的實體實例


l 遵循范式化規(guī)則,將“一個事實放在一個地方”,一個屬性只能分配給一個實體,作為該實體的標識符或作為該實體的描述性屬性,而不能分配給其他實體,在組織的數(shù)據(jù)范圍內保持唯一性,從而實現(xiàn)真相的單一版本


l 建立連接現(xiàn)實世界中業(yè)務實體的關系。從邏輯業(yè)務角度(而不是從報表模式或數(shù)據(jù)訪問角度,統(tǒng)計報表中的不同維度組合不是業(yè)務實體關系)捕獲業(yè)務關系至關重要,這些關系是現(xiàn)在和將來所有已知和未知潛在訪問模式的基礎


l 在提升數(shù)據(jù)集成成熟度的同時,持續(xù)集成更多業(yè)務數(shù)據(jù),把企業(yè)數(shù)據(jù)集成為一個有機的整體


圖2:業(yè)務價值隨持續(xù)集成的數(shù)據(jù)增長



03

從基礎數(shù)據(jù)集成開始


確定集成路線圖的初始數(shù)據(jù)范圍很重要,以確保承諾的價值交付時間表。數(shù)據(jù)部門人員通常會注意到:不同的應用需求,經常需要一些相同的數(shù)據(jù),如客戶、機構、利率、匯率等主數(shù)據(jù)以及參考數(shù)據(jù)幾乎被所有應用所需。某些跨職能應用問題具有廣泛的業(yè)務影響,需要多個主題域來回答,提供前瞻性洞察。應采用務實的策略,盡快滿足業(yè)務的迫切需求,優(yōu)先考慮公共需要的數(shù)據(jù)以及那些直接支持業(yè)務目標的已知業(yè)務問題并為后續(xù)新項目增加附加價值的數(shù)據(jù),如風險合規(guī)和財務會計以及客戶、產品主數(shù)據(jù)等,杠桿撬動作用大,見效快。


以客戶數(shù)據(jù)為例,客戶數(shù)據(jù)是企業(yè)的戰(zhàn)略數(shù)據(jù),企業(yè)價值的實現(xiàn)來自客戶。作為關鍵主數(shù)據(jù)的客戶數(shù)據(jù),可能分布在組織內部不同業(yè)務系統(tǒng)中,來自不同數(shù)據(jù)源表達的信息要素各有側重,客戶的結構屬性可能有交叉、互補與差異,屬性的格式與值有差異,客戶記錄數(shù)也可能有差異,需要集成形成完整一致的集合。不同行業(yè)組織之間的客戶數(shù)據(jù)也存在以上這些差異。比如保險業(yè)、銀行業(yè)、電信業(yè)關注的信息要素可能有許多不同,包括客戶的定義信息、客戶購買產品歷史、行為偏好等,如何從客戶數(shù)據(jù)中獲取價值,都將成為獲得競爭優(yōu)勢的關鍵途徑。


通過持續(xù)集成來自組織內外不同數(shù)據(jù),可以形成客戶信息360° 視圖,了解產品與服務組合的變化對客戶的影響, 更快地識別客戶需求、問題、機會,擴大客戶群,給不同客戶提供不同服務,更有效地向客戶交叉銷售,提升客戶給企業(yè)帶來的價值。而在應用需求驅動的背景之下,如同盲人摸象,每個人得到的僅是局部片面的信息。


類似還有市場數(shù)據(jù)、產品數(shù)據(jù)的集成,特別是市場數(shù)據(jù)的集成,如基金市場的產品數(shù)據(jù),銀行既可以代銷,也可以使用自有資金投資,本是同一產品概念,在通過不同的渠道接入不同的業(yè)務系統(tǒng)時設計了不一致的結構,維護了不同的數(shù)據(jù)集合,在進行整合時往往不被識別出來而設計成不同的概念,如代銷基金產品、共同基金產品。




04

結合最新技術與實踐

構建企業(yè)集成語義層


需要注意的是,盡管傳統(tǒng)的ETL或ELT數(shù)據(jù)集成流程已經存在了很多年,但數(shù)據(jù)的集成并不意味著一定伴隨數(shù)據(jù)的移動與復制,可以與數(shù)據(jù)的位置無關,基于云的數(shù)據(jù)集成平臺越來越普遍。復制需要時間與資源,復制過程可能導致數(shù)據(jù)泄漏、丟失或變形失真。在許多數(shù)據(jù)平臺與數(shù)據(jù)應用項目中,不斷復制數(shù)據(jù),把數(shù)據(jù)從業(yè)務源系統(tǒng)復制到數(shù)據(jù)湖,再加工復制到數(shù)據(jù)倉庫,從數(shù)據(jù)倉庫遷移到各種集市,野蠻生長之后再進行治理。不同業(yè)務系統(tǒng)中的數(shù)據(jù)價值差異懸殊,一些非核心業(yè)務系統(tǒng)中有價值的數(shù)據(jù)很少,都復制到數(shù)據(jù)湖中是不明智的。ChatGPT 推動的生成式 AI 興起,點燃了對高質量數(shù)據(jù)的需求(質量、時效性與覆蓋范圍),傳統(tǒng)ETL或ELT方法不可能滿足這些要求。


結合應用數(shù)據(jù)架構、分類法、本體模型、業(yè)務詞匯表、元數(shù)據(jù)和知識圖譜的關鍵元素,表示組織知識和領域含義,聚合和統(tǒng)一非結構化和結構化數(shù)據(jù),定義數(shù)據(jù)之間的關系,通過持續(xù)的數(shù)據(jù)探索,集成和編目,構建集成的業(yè)務語義層,提供來自任何領域的一致信息視圖,而無需將所有內容都復制移動到一個系統(tǒng)中。借助集成語義層,可以使用單一框架來訪問、理解和集成知識資產,這也是實現(xiàn)人工智能的基礎。


2016年 Noel Yuhanna(Forrester)首次提出了大數(shù)據(jù)編織概念,在Gartner推動下,數(shù)據(jù)編織已成為現(xiàn)代數(shù)據(jù)管理的重要趨勢。數(shù)據(jù)編織不強制數(shù)據(jù)物理遷移,通過主動元數(shù)據(jù)、知識圖譜、人工智能(AI)和機器學習(ML)等技術,動態(tài)整合跨平臺、跨環(huán)境的數(shù)據(jù),實現(xiàn)數(shù)據(jù)的自動化探索、集成、治理和交付。數(shù)據(jù)編織已從“創(chuàng)新萌芽期”進入“期望膨脹期”,雖沒有全面成熟,數(shù)據(jù)虛擬化、主動元數(shù)據(jù)管理、AI驅動的數(shù)據(jù)集成等技術已相對成熟,可用于實現(xiàn)邏輯數(shù)據(jù)集成和動態(tài)編排。



結語:


決策是根據(jù)可用的數(shù)據(jù)做出的,數(shù)據(jù)集成越成功,用戶越有能力提出與解決更復雜的問題。基于整個組織可用的數(shù)據(jù)的高級用戶可以提出并解答更多的跨領域的問題,提供競爭對手看不到的業(yè)務洞察和整體管理業(yè)務的能力。對于許多組織來說,數(shù)據(jù)集成之路還很漫長,需要提升專業(yè)能力,需要有企業(yè)級的業(yè)務架構、數(shù)據(jù)架構和應用架構設計思考,充分利用數(shù)據(jù)編織、人工智能 、知識圖譜、DataOps等新架構、新技術、新知識。






讓中國金融科技 具有世界影響力
長亮科技更懂如何為您的數(shù)字化轉型賦能