資料倉儲
一种存储系统 / 維基百科,自由的 encyclopedia
在電腦領域,資料倉儲(英語:data warehouse,也稱為企業資料倉儲)是用於報告(英語:Business reporting)和資料分析的系統,被認為是商業智慧型的核心組件[1]。 資料倉儲是來自一個或多個不同源的整合資料的中央儲存庫。資料倉儲將當前和歷史資料儲存在一起[2],用於為整個企業的員工建立分析報告[3]。
儲存在倉庫中的資料從執行系統(例如行銷或銷售)上傳。這些資料可能會通過一個ODS資料庫,並且可能需要進行額外操作的資料清理[2],以確保資料品質(英語:data quality),然後才能在資料倉儲中用於報告。
典型的基於提取、轉換、載入(ETL)的資料倉儲[4]使用分級、資料整合和訪問層來存放其關鍵功能。分級層或分級資料庫儲存從每個不同的源資料系統中提取的原始資料。整合層通過轉換來自分級層的資料,將不同的資料集合在一起,通常將轉換後的資料儲存在ODS資料庫中。然後將整合的資料轉移到另一個資料庫(通常稱為資料倉儲資料庫),在這個資料庫中,資料被分為層次組(通常稱為維度),並被分成事實和聚合事實。事實和維度的組合有時被稱為星型模式。訪問層幫助使用者檢索資料。[5]
資料的主要來源被清理、轉換、分類,並提供給管理人員和其他商業專業人員用於資料探勘、線上分析處理、市場研究和決策支援[6]。 然而,檢索和分析資料、提取、轉換和裝載資料以及管理資料字典的方法也被認為是資料倉儲系統的基本組成部分。許多資料倉儲的文獻都使用了這個更廣泛的語境。因此,資料倉儲的擴充定義包括商業智慧型工具(英語:business intelligence tools)、提取、轉換和載入資料到儲存庫的工具,以及管理和檢索元資料的工具。