資料倉儲是一個面向主題的整合的相
對穩定的反映歷史變化的資料集合Y用於支援管理決策
面向主題
2整合
3相對穩定
4反映歷史變化
資料庫是面向事務的設計Y資料倉儲是面向主題設計的資料庫
一般儲存線上交易資料Y資料倉儲儲存的一般是歷史資料資料
庫是為捕獲資料而設計Y資料倉儲是為分析資料而設計的。
一個典型的資料倉儲系統通常包含資料來源資料儲存和管理
oLAp伺服器前端工具和應用等四個部分。
資料來源x是資料倉儲的基礎系統的資料來源Y包含企業的各種內部數
據和外部資料內部資料包括存在於oLtp系統中的各種業務資料和辦
公自動化系統中的各類文件資料外部資料包括各類法律法規市場信
息競爭對手資訊及各類外部統計資料和其他相關文件等。
資料儲存和管理x是資料倉儲系統的核心是指在各業務系統基礎上週
期性地對資料進行抽取按照主題進行重新組織Y最終確定資料倉儲的物理儲存結構Y同
時儲存資料倉儲的各種後設資料?資料字典記錄系統定義資料轉換規
則資料載入頻率及業務規則等?對資料倉儲系統的管理Y就是對相
應資料庫系統的管理Y通常包括資料的安全歸檔備份維護和恢復
等工作。
oLAp伺服器x聯機分析處理伺服器將需要分析的資料按照多維資料模
型進行重組Y以支援使用者隨時多角度多層次進行資料分析Y發現資料
規律與趨勢
前端工具和應用x資料查詢工具自由報表工具資料分析工具資料
挖掘工具和各類應用系統。
實時主動資料倉儲是一個整合的資訊儲存倉庫Y既具備批次和週期性的資料
載入能力?採用EtL技術?Y也具備資料變化的實時探測傳播和載入能力
?採用cdc技術?Y並能結合歷史資料和新穎資料實現查詢分析和自動規則
觸發Y從而提供對戰略決策和戰術決策的雙重支援。
資料整合。
不同資料來源的資料被物理地整合到資料目標
利用EtL工具把資料來源中的資料批次地載入到資料倉儲就屬於資料整
合。
資料聯邦。
在多個資料來源的基礎上建立統一的邏輯檢視Y對外界應用遮蔽資料
在各個資料來源的分佈細節
對應用而言Y只有一個資料訪問入口Y但事實是被請求的資料只是
邏輯上的集中Y物理上仍然分佈在各個資料來源中
只有收到請求時Y資料倉儲才臨時從不同資料來源獲取相關資料Y進
行整合後提交給資料請求者。
資料傳播。
資料在多個應用之間傳播
在企業應用整合解決
方案中Y不同應用之間可以透過傳播訊息進行互動
4混合方式
對那些不同應用都使用的資料採用資料整合的方式進行整合Y而對
那些只有特定應用才使用的資料則採用資料聯邦方式進行整合。
有多種技術可以為實時主動資料倉儲提供資料整合服務Y比如指令碼EtL
EAI和cdc但是Y只有部分技術能提供實時(連續)的資料整合x
?
1?指令碼指令碼是資料整合的一種快速解決方案Y其優點是Y使用靈活且比
較經濟Y很容易著手開發和進行修改Y幾乎任何作業系統和絕大部分dbmS都
可以使用指令碼但是Y使用指令碼也有很多問題Y比如Y耗費開發者的時間和
精力Y不好管理和操作Y以及不能滿足服務水平協議?
等等。
有多種技術可以為實時主動資料倉儲提供資料整合服務Y比如指令碼EtL
EAI和cdc但是Y只有部分技術能提供實時(連續)的資料整合x
?
2?EtLEtL是實現大規模資料初步載入的理想解決方案Y它提供了高階
的轉換能力EtL任務通常都是在 維護時間視窗進行Y在EtL任務執行期間Y