Database

此應用程序是數據保險庫、數據集市還是數據倉庫?

  • November 4, 2019

我正在從各種源系統導入資訊並將它們放入本地數據庫進行報告。例如,來源之一是Google分析。

以下是此導入過程的一些屬性:

  1. 我正在從源系統(例如 Google Analytics)收集數據。
  2. 數據進入我的本地數據庫。
  3. 數據流向一個方向,即對本地數據庫的唯一寫訪問是導入程序程序。
  4. 本地數據庫是源系統的視圖。即它不是上游數據庫的全保真副本。

鑑於這些屬性,我的本地數據庫會被稱為數據集市、數據保險庫還是數據倉庫?

這個詞的選擇對我來說很重要,因為我們公司將把我們的工具作為開源發布。如果我們使用行業公認的最佳術語來描述我們的工具的功能,那麼它將更有價值。

在查看了相應的 Wikipedia 文章並根據我的經驗(儘管它在該領域受到限制)後,我建議使用數據倉庫

  • 數據倉庫 這個術語可能最適用於所描述的應用程序。數據倉庫也與 ETL 流程密切相關,這意味著如果您正在發布 ETL 工具,人們會理解它們與數據倉庫合作……
  • Data Vault 這個術語似乎側重於歷史數據的收集
  • 數據集市 這個術語側重於作為實際數據倉庫的一個子集。

我承認,直到這個問題,我從未聽說過“數據保險庫”。最後,在發布和選擇“最佳”名稱之前,請與市場部核實他們是否對名稱有任何偏好——工具不必總是在他們所做的事情之後被呼叫(儘管我更喜歡這種風格)。

引用自:https://serverfault.com/questions/990519