資料挖掘評估


資料倉庫

資料倉庫表現出以下特點,以支援管理層的決策過程:

  • 面向主題 - 資料倉庫是面向主題的,因為它為我們提供圍繞一個主題而組織的持續經營的資訊。這些主題可以是產品,客戶,供應商,銷售,收入等資料倉庫不注重持續經營,而它專注於建模和決策分析資料。

  • 整合 - 資料倉庫是整合來自異類源如關聯式資料庫,平面檔案等,這整合提高資料的有效分析資料構成。

  • 時間變數 - 在資料倉庫中的資料是確定與一個特定的時間段。在資料倉庫中的資料從歷史的角度來看提供的資訊。

  • 非易失性 - 非揮發性的是指當新的資料被新增到它的先前的資料不會被刪除。資料倉庫是分開的運算元據庫,因此經常發生的改變運算元據庫不反映在資料倉庫中。

資料倉庫

資料倉庫的建設和使用資料倉庫的過程。資料倉庫是通過整合來自多個異構資料源的資料構成。這個資料倉庫支援的分析報告,結構和/或特殊查詢和決策。

資料倉庫涉及??資料清理,資料整合和資料整合。整合異構資料庫整合到我們有兩種方法如下異構資料庫:

  • 查詢驅動的方法

  • 更新驅動的方法

查詢驅動的方法

這是傳統的方法來整合異構資料庫。這種方法被用來建立封裝和整合多個異構資料庫的頂部。這些積分器也被稱為媒介。

處理查詢驅動的方法

  • 當查詢被頒發給一個用戶端,一個後設資料字典查詢翻譯成適合於所涉及的各個異構的網站查詢。

  • 現在,這些查詢對映並行送到區域性查詢處理器。

  • 從異構位點的結果都整合到一個全域性回答集。

缺點

這種方法有以下缺點:

  • 查詢驅動的方法需要複雜的整合和篩選的過程。

  • 這種做法是非常低效的。

  • 這種方法是常用的查詢非常昂貴。

  • 這種方法也是查詢非常昂貴,需要聚合。

更新驅動的方法

我們提供了另一種方法來傳統的方法。今天的資料倉庫系統如下更新驅動的方法,而不是前面討論的傳統方法。在更新驅動的方法從多個異構資料源的資訊整合在預先儲存在倉庫中。此資訊可直接查詢和分析。

優點

這種方法具有以下優點:

  • 這種方法提供了高效能。

  • 該資料被複製,處理,整合,注釋,總結和調整的提前語意資料儲存。

查詢處理不需要介面與所述處理在本地源。

從資料倉庫(OLAP)資料挖掘(OLAM)

聯機分析挖掘整合了聯機分析處理與多維資料庫的資料挖掘和知識挖掘。下面是顯示整合OLAP和OLAM的圖:

OLAP to OLAM

OLAM重要性:

這裡是OLAM的重要性列表:

  • 資料在資料倉庫的高品質 - 資料挖掘工具都需要工作在整合的,一致的,並清理資料。這些步驟是非常昂貴的資料預處理。通過這樣的預處理構建的資料倉庫均採用優質有價值的資料源,OLAP和資料挖掘為好。

  • 圍繞資料倉庫可用資訊處理基礎設施 - 資訊處理的基礎設施指的是存取,整合,整合和多個異構資料庫,網路接入和服務設施,報表和OLAP分析工具的轉變。

  • 基於OLAP的探索性資料分析 - 需要有效的資料挖掘探索性資料分析。 OLAM提供各種子組資料,並在不同的抽象層次的機構進行資料挖掘。

  • 線上選擇資料挖掘功能 - OLAP整合多個資料挖掘功能,聯機分析挖掘為使用者提供了靈活動態地選擇所需的資料挖掘功能和交換資料挖掘任務。