日本免费精品视频,男人的天堂在线免费视频,成人久久久精品乱码一区二区三区,高清成人爽a毛片免费网站

在線客服
數據倉庫工具箱(第3版)·維度建模指南圖書
人氣:31

數據倉庫工具箱(第3版)·維度建模指南

匯集了到目前為止*的維度建模技術,14個案例涉及零售業、電子商務、客戶關系管理、采購、庫存、訂單管理、會計、人力資源、金融服務、醫療衛生、保險、教育、電信和運輸等
  • 所屬分類:圖書 >計算機/網絡>數據庫>數據倉庫與數據挖掘  
  • 作者:(美)[金博爾],(美)[羅斯] 著,[王念濱],[周連科],[韋正現] 譯
  • 產品參數:
  • 叢書名:大數據應用與技術叢書
  • 國際刊號:9787302385530
  • 出版社:清華大學出版社
  • 出版時間:2015-01
  • 印刷時間:2015-01-01
  • 版次:1
  • 開本:16開
  • 頁數:--
  • 紙張:膠版紙
  • 包裝:平裝-膠訂
  • 套裝:

內容簡介

隨著The Data Warehouse Toolkit(1996)第1版的出版發行,Ralph Kimball為整個行業引入了維度建模技術。從此,維度建模成為一種被廣泛接受的表達數據倉庫和商業智能(DW/BI)系統中數據的方法。該經典書籍被認為是維度建模技術、模式和實踐的資源。

這本《數據倉庫工具箱(第3版)——維度建模指南》匯集了到目前為止的維度建模技術。本書采用新的思路和實踐對上一版本進行了修訂,給出了設計維度模型的指南,既適合數據倉庫新手,也適合經驗豐富的專業人員。

本書涉及的所有技術都基于作者實際從事DW/BI的設計經驗,通過實際案例加以描述。

主要內容

實用設計技術——有關維度和事實表的基本和高級技術

14個案例研究,涉及零售業、電子商務、客戶關系管理、采購、庫存、訂單管理、會計、人力資源、金融服務、醫療衛生、保險、教育、電信和運輸等

為12個案例研究提供了數據倉庫總線矩陣示例

需要避免的維度建模陷阱和錯誤

增強的緩慢變化維度(SCD)技術類型0~類型7

用于處理參差不齊的可變深度層次和多值屬性的橋接表

大數據分析的實踐

與業務參與方合作、交互設計會議的指南

有關Kimball DW/BI項目生命周期方法論的概論

對ETL系統和設計思考的總結

構建維度和事實表的34個ETL子系統和技術

編輯推薦

本書版本已出版,點擊書名查看:

Microsoft數據倉庫工具箱(第2版)——使用SQL Server 2008 R2和Microsoft BI工具集》

作者簡介

Ralph Kimball博士自1982年以來,一直是數據倉庫和商業智能行業的思想開拓者。自1996年以來,The Data Warehouse Toolkit系列書籍一直是最受讀者歡迎的暢銷書。

Margy Ross是Kimball集團總裁,她與Ralph Kimball合作撰寫了5本工具箱系列書籍。她關注數據倉庫和商業智能已有30多年的歷史。

目錄

第1章 數據倉庫、商業智能及維度建模初步

1.1 數據獲取與數據分析的區別

1.2 數據倉庫與商業智能的目標

1.3 維度建模簡介

1.3.1 星型模式與OLAP多維數據庫

1.3.2 用于度量的事實表

1.3.3 用于描述環境的維度表

1.3.4 星型模式中維度與事實的連接

1.4 Kimball的DW/BI架構

1.4.1 操作型源系統

1.4.2 獲取.轉換_加口載(ETL)系統

1.4.3 用于支持商業智能決策的展現區

1.4.4 商業智能應用

1.4.5 以餐廳為例描述Kimball架構

1.5 其他DW/BI架構

1.5.1 獨立數據集市架構]

1.5.2 輻射狀企業信息工廠Inmon架構

1.5.3 混合輻射狀架構與Kimball架構

1.6 維度建模神話

1.6.1 神話1:維度模型僅包含匯總數據

1.6.2 神話2:維度模型是部門級而不是企業級的

1.6.3 神話3:維度模型是不可擴展的

1.6.4 神話4:維度模型僅用于預測

1.6.5 神話5:維度模型不能被集成

1.7 考慮使用維度模型的

更多理由

1.8 本章小結

第2章 Kimball維度建模技術概述

2.1 基本概念

2.1.1 收集業務需求與數據實現

2.1.2 協作維度建模研討

2.1.3 4步驟維度設計過程

2.1.4 業務過程

2.1.5 粒度

2.1.6 描述環境的維度

2.1.7 用于度量的事實

2.1.8 星型模式與OLAP多維數據庫

2.1.9 方便地擴展到維度模型

2.2 事實表技術基

2.2.1 事實表結構

2.2.2 可加、半可加、不可加事實

2.2.3 事實表中的空值

2.2.4 一致性事實

2.2.5 事務事實表

2.2.6 周期快照事實表

2.2.7 累積快照事實表

2.2.8 無事實的事實表

2.2.9 聚集事實表或OLAP多維數據庫

2.2.1 0合并事實表

2.3 維度表技術基

2.3.1 維度表結構

2.3.2 維度鍵

2.3.3 自然鍵、持久鍵和超自然鍵

2.3.4 下鉆

2.3.5 退化維度

2.3.6 非規范化扁平維度

2.3.7 多層次維度

2.3.8 文檔屬性的標識與指示器

2.3.9 維度表中的空值屬性

2.3.10 日歷日期維度

2.3.11 扮演角色的維度

2.3.12 雜項維度

2.3.13 雪花維度

2.3.14 支架維度

2.4 使用一致性維度集成

2.4.1 一致性維度

2.4.2 縮減維度

2.4.3 跨表鉆取

2.4.4 價值鏈

2.4.5 企業數據倉庫總線架構

2.4.6 企業數據倉庫總線矩陣

2.4.7 總線矩陣實現細節

2.4.8 機會/利益相關方矩陣

2.5 處理緩慢變化維度屬性

2.5.1 類型0:原樣保留

2.5.2 類型1:重寫

2.5.3 類型2:增加新行

2.5.4 類型3:增加新屬性

2.5.5 類型4:增加微型維度

2.5.6 類型5:增加微型維度及類型1支架

2.5.7 類型6:增加類型1屬性到類型2維度

2.5.8 類型7:雙類型l和類型2維度

2.6 處理維度層次關系

2.6.1 固定深度位置的層次

2.6.2 輕微參差不齊/可變深度層次

2.6.3 具有層次橋接表的參差不齊/可變深度層次

2.6.4 具有路徑字符屬性的可變深度層次

2.7 高級事實表技術

2.7.1 事實表鍵

2.7.2 蜈蚣事實表

2.7.3 屬性或事實的數字值

2.7.4 日志/持續時間事實

2.7.5 頭/行事實表

2.7.6 分配的事實

2.7.7 利用分配建立利潤與損失事實表

2.7.8 多種貨幣事實

2.7.9 多種度量事實單位

2.7.1 0年.日事實

2.7.1 1多遍SQL以避免事實表間的連接

2.7.1 2針對事實表的時間跟蹤1

2.7.1 3遲到的事實

2.8 高級維度技術

2.8.1 維度表連接

2.8.2 多值維度與橋接表

2.8.3 隨時間變化的多值橋接表

2.8.4 標簽的時間序列行為

2.8.5 行為研究分組

2.8.6 聚集事實作為維度屬性

2.8.7 動態值范圍

2.8.8 文本注釋維度

2.8.9 多時區

2.8.10 度量類型維度

……

第3章 零售業務

第4章 庫存

第5章 采購

第6章 訂單管理

第7章 會計

第8章 客戶關系管理

第9章 人力資源管理

第10章 金融服務

第11章 電信

第12章 交通運輸

第13章 教育

第14章 醫療衛生

第15章 電子商務

第16章 保險業務

第17章 KimballDW/BI生命周期概述

第18章 維度建模過程與任務

第19章 ETL子系統與技術

第20章 ETL系統設計與開發過程和任務

第21章 大數據分析

在線預覽

自Ralph Kimball于1996年首次出版The Data Warehouse Toolkit(Wiley)一書以來,數據倉庫和商業智能(Data Warehousing and Business Intelligence,DW/BI)行業漸趨成熟。盡管初期僅有部分大型公司采用,但從那時起,DW/BI逐漸為各種規模的公司所青睞。業界已建立了數以千計的DW/BI系統。隨著數據倉庫原子數據的不斷增加以及更新越來越頻繁,數據容量不斷增長。在我們的職業生涯中,我們見證了數據庫容量從MB到GB再到TB甚至PB的發展過程,但是,DW/BI系統面臨的基本挑戰并未發生重大變化。我們的工作就是管理組織中的數據并將其用于業務用戶的決策制定過程中。總的來說,您必須實現這一目標,確保商務人士制定更好的決策,并從他們的DW/BI投資中獲得回報。

自The Data Warehouse Toolkit第1版出版以來,維度建模作為一種主要的DW/BI展現技術受到廣泛認可。從業者與學者都認識到數據展現要獲得成功,就必須建立在簡單性的基礎之上。簡單性是使用戶能夠方便地理解數據庫,使軟件能夠方便地訪問數據庫的基礎性的關鍵要素。許多情況下,維度建模就是時刻考慮如何能夠提供簡單性。堅定不移地回到業務驅動的場景,堅持以用戶的可理解性和查詢性能為目標,才能建立始終如一地服務于組織的分析需求的設計。維度建模框架將成為BI的平臺。基于我們多年來積累的經驗以及大量實踐者的反饋,我們相信維度建模是DW/BI項目成功的關鍵。

維度建模還是建立集成化的DW/BI系統的主導結構。當您使用維度模型的一致性維度和一致性事實時,可以增量式地建立具有可實踐的、可預測的、分布式的復雜DW/BI系統的框架。

盡管業界的一切始終在變化,但Ralph Kimball于17年前提出的核心維度建模技術經受住了時間的考驗。諸如一致性維度、緩慢變化維度、異構產品、無事實的事實表以及企業數據倉庫總線矩陣等概念仍然是全球范圍內設計論壇所討論的問題。最初的概念通過新的和互補的技術被逐漸完善并強化。我們決定對Kimball的書籍發行第3版,因為我們感到有必要將我們所收集到的維度建模經驗匯集到一本書中。我們每個人都具有30年以上的關注決策支持、數據倉庫和業務智能的經歷。我們希望分享在職業生涯中反復利用的維度建模模式。本書還包含基于現實場景的特定的實踐性的設計建議。

本書的目標是提供維度建模技術的一站式商店。正如書名所體現的那樣,本書是一本維度設計原則和技術的工具箱。本書既能滿足那些剛剛進入維度DW/BI行業的新手的需要,也描述了許多高級概念以滿足那些長期戰斗在這一行業的老手的需要。我們相信本書在維度建模主題方面所涵蓋內容的深度是的。本書是性的指南。

預期讀者

本書面向數據倉庫和商業智能設計人員、實踐人員和管理人員。此外,積極參與DW/BI項目的業務分析人員和數據管理者也會發現本書內容對他們來說是非常有益的。

即使您并未直接負責維度模型的開發工作,但我們相信熟悉維度建模的概念對項目組所有成員都是非常重要的。維度模型對DW/BI實現的許多方面都有影響,從業務需求的轉換開始,通過獲取、轉換和加載(ETL)過程,到通過商業智能應用數據倉庫的整個過程。由于涉及內容的廣泛性,無論您是主要負責項目管理、業務分析、數據結構、數據庫設計、ETL和BI應用,還是教育和支持,都需要熟悉維度建模。本書適合于方方面面的讀者。

對那些已經閱讀過本書前期版本的讀者來說,在本書中將發現一些熟悉的案例研究,然而,這些案例都被更新了,增加了更豐富的內容,幾乎每個案例都包括樣例企業數據倉庫總線矩陣。我們為新的主題區域(包括大數據分析)提供了相應內容。

本書內容偏向對技術的討論。主要從關系數據庫環境出發討論維度建模,這一環境與聯機分析處理(OLAP)存在的細微差別在適當之處都進行了說明。本書假定讀者對關系數據庫概念有一定的了解,例如表、行、鍵和連接等。鑒于我們在討論維度模型時不采用某一特定的方法,所以不會就某一特定數據庫管理系統具體的物理設計和調整指導展開深入的討論。

各章預覽

本書將圍繞一系列商業場景或案例研究進行組織。我們相信通過實例來研究設計技術是最有效的方法,因為這樣做可以使我們分享非常實際的指導以及現實世界的適用經驗。盡管未提供完整的應用或業界解決方案,但這些案例可用來討論出現在維度建模中的模式。據我們的經驗來看,通過遠離自己所熟悉的復雜問題,更容易抓住設計技術的要素。閱讀過本書以前各版本的讀者對這一方法的反應非常積極。

請注意我們在第2章未采用案例研究方法。鑒于Kimball集團所發明的維度建模技術得到行業的廣泛認可,我們整理出了這些技術,并簡短地進行了描述。盡管并不指望讀者會像閱讀其他章節那樣從頭到尾仔細閱讀,但我們覺得這一以技術為中心的章節對讀者來說是一種有益的參考。

除第2章以外,本書其他章節相互關聯。我們以基本概念開始,隨著內容的展開,介紹了更高級的內容。讀者應該順序閱讀各章。例如,除非您閱讀了第16章之前有關零售、采購、訂單管理和客戶關系管理的那幾章的內容,否則很難理解第16章的相關內容。

對那些已經閱讀過本書以前版本的讀者來說,可能會忽略前面幾章。盡管對前面的事實和維度比較熟悉,但不希望讀者跳過太多的章節,否則可能會錯過一些已經更新的基本概念。

第1章:數據倉庫、商業智能及維度建模初步

本書以數據倉庫、商業智能及維度建模入門開始,探討了整個DW/BI結構的所有組件并建立了本書其他章節所用到的核心詞匯。消除了一些有關維度建模的神化和誤解。

第2章:Kimball維度建模技術概述

本章描述了超過75個維度建模技術以及模式。

第3章:零售業務

零售是用于描述維度建模的經典實例。我們之所以從該行業開始討論是因為該行業為大眾所熟悉。并不需要大家都對該行業有非常深入的了解,因為我們主要是希望通過該章的學習使大家能夠關注核心的維度建模概念。該章以設計維度模型常用的4步過程開始,對維度表開展了深入的研究,包括貫穿全書反復使用的日期維度。同時,我們還討論了退化維度、雪花維度以及鍵。即使您并不從事零售行業的工作,也需要仔細閱讀這一章,因為該章是其他各章的基礎。

第4章:庫存

該章是對第3章零售業討論的延伸,討論了零售業的另一個案例,但請將注意力轉移到零售業的另一個業務過程上。該章介紹了企業數據倉庫總線架構以及具有一致性維度的總線矩陣。這些概念對那些希望建立集成的、可擴展的DW/BI架構的人來說是非常關鍵的一章。我們還討論了三種基礎類型的事實表:事務、周期快照和累積快照。

第5章:采購

該章強調了在構思DW/BI環境時,企業組織的價值鏈的重要性。我們還探討了用于處理緩慢變化維度屬性的一系列基礎的和高級的技術;討論了基本的類型1(重寫)、類型2(增加行)和類型3(增加列),并在此基礎上介紹了類型0,以及類型4~類型7。

第6章:訂單管理

在研究該案例時,我們考察了在DW/BI系統中常常需要首先考慮實現的業務過程,因為這些過程支持核心業務性能度量——我們將哪些商品以何種價格賣給哪些顧客?討論了在模式中扮演多種角色的維度。還討論了在處理訂單管理信息時,建模人員將會面對的常見挑戰,例如,表頭/列表項考慮、多幣種或多種度量單位,以及五花八門的事務標識符的雜項維度等。

第7章:會計

該章主要討論了建模數據倉庫中的總賬信息。描述了處理年度-日期(year-to-date)事實和多種財政日歷,以及將多個業務過程中的數據合并到事實表的適當方法。還對維度屬性層次提供了詳細的指導,從簡單的規范的固定深度層次到包含參差不齊的可變深度層次的橋接表。

第8章:客戶關系管理

大量的DW/BI系統建立在需要更好地理解客戶并向其提供服務的前提下。該章討論了客戶維度,包括標準化地址和處理多值維度屬性的橋接表。該章還討論了對復雜的客戶行為建模的模式,以及如何從多個數據源中合并客戶數據的方法。

第9章:人力資源管理

該章討論了人力資源維度模型具有的幾種特性,包括那些維度表行為類似事實表的情況。該章討論了分析方案軟件包,以及對遞歸管理層次及調查問卷的處理方法。對幾種處理多值技能關鍵詞屬性的方法進行了比較。

第10章:金融服務

銀行案例研究探討了那些每個業務列表項具有特定描述性屬性和性能度量的異構產品的超類和子類模式的概念。顯然,并不是只有金融服務行業需要處理異構產品。該章還討論了賬戶、客戶和家庭之間所存在的復雜關系。

第11章:電信

該章從結構上來看與前幾章有一些差別,主要是為了鼓勵讀者在執行維度模型設計評審時辯證地考慮問題。該章從乍看似乎是合理的維度設計開始。您能夠從中發現什么問題?此外,該章還討論了地理位置維度的特性。

第12章:交通運輸

該章的案例考察了不同粒度級別的相關事實表,指出描述旅程或網絡中區段的事實表的特性。進一步深入考察了日期和時間維度,包括特定國家日歷和跨多個時區的同步問題。

第13章:教育

該章考察了幾類無事實的事實表。此外,探討了處理學生應用和研究基金申請流水線的累積快照事實表。該章為讀者提供了了解教育團體中各種各樣業務過程的機會。

第14章:醫療衛生

我們所遇見的最復雜的模型來自醫療衛生行業。該章描述了處理此類復雜性的方法,包括使用橋接表建模多項診斷以及與病人治療事件相關的提供商。

第15章:電子商務

該章主要關注點擊流Web數據的細節,包括其獨有的多維性。該章還介紹了用于更好地理解包含順序步驟的任何過程的步驟維度。

第16章:保險業務

作為本書提供的一個案例研究,我們將書中前述的各個模式關聯到一起。可將該章看成是對以前各個章節的總結,因為這些建模技術按層次劃分。

第17章:Kimball DW/BI生命周期概述

通過前述章節的介紹,您已經熟悉了維度模型的設計方法,該章概述了在典型的DW/BI項目生命周期中將會遇到的活動。該章是對由我們與Bob Becker、Joy Mundy和Warren Thornthwaite共同編寫的The Data Warehouse Lifecycle Toolkit, Second Edition(Wiley, 2008)一書的簡短概述。

第18章:維度建模過程與任務

該章對處理Kimball生命周期中的維度建模任務提出了具體的建議。本書的前16章包含維度建模技術和設計模式;該章描述責任、操作方式,以及維度建模設計活動的物。

第19章:ETL子系統與技術

在構建DW/BI環境時,ETL(獲取、轉換、加載)系統將會消耗大量的時間和精力,與其他部分工作比較,幾乎不成比例。仔細考慮的實踐揭示了在幾乎所有維度數據倉庫后端都將發現的34個子系統。該章首先討論了在設計ETL系統之前必須考慮的需求和約束,然后描述了34個與獲取、清洗、一致性、和管理有關的子系統。

第20章:ETL系統設計與開發過程和任務

該章深入探討了與ETL設計和開發活動有關或無關的具體技術。那些對ETL負有責任的讀者都應該閱讀本章。

第21章:大數據分析

一章主要關注大數據這一正在流行的主題。我們認為,大數據是對DW/BI系統的自然擴展。首先討論了幾種可選的結構,包括MapReduce和Hadoop,描述了這些可選系統如何與當前的DW/BI結構共存的問題。接著討論了針對大數據的管理、結構、數據建模和數據治理的實踐。

Web資源

Kimball集團網站包含許多補充的維度建模內容和資源:

● 注冊Kimball Design Tips可收到有關維度建模和DW/BI主題的實踐指導。

● 訪問目錄可獲得300個設計技巧和文章。

● 通過學習Kimball大學公開的和現場的課程,可獲得高質量、獨立于提供商的教育,并分享我們的經驗和文章。

● 獲得Kimball集團咨詢服務以利用我們幾十年積累的有關DW/BI的寶貴經驗。

● 向Kimball論壇的其他維度設計參與者提問。

小結

本書的寫作目標是基于作者60多年來從實際業務環境中獲得的經驗和來之不易的教訓,為讀者提供正式的維度設計和開發技術。DW/BI系統必須以業務用戶的需求來驅動,如此才能真正從維度角度設計和展現。我們堅信,如果您能夠接受這一前提,將會朝建立成功的DW/BI系統邁出巨大的一步。

既然知道從何開始,請開始仔細閱讀本書。在第1章中將討論DW/BI和維度建模的基本內容,確保每個人對關鍵術語和結構性概念具有統一的認識。

網友評論(不代表本站觀點)

來自zzhongh**的評論:

很多案例,做集市的時候再來參考。

2016-08-05 12:52:08
來自無昵稱**的評論:

書不錯 物流也很快

2016-08-31 12:18:03
來自無昵稱**的評論:

好書,數據倉庫兩大流派之一,更實用。

2016-10-05 10:24:51
來自云淡瘋**的評論:

速度相當慢

2016-11-01 21:30:35
來自molimol**的評論:

書的質量不錯,沒基礎的話,看起來會有點累

2016-11-03 10:34:43
來自微笑每**的評論:

好用的書頂多大啊?

2016-11-05 22:17:53
來自無昵稱**的評論:

你好,為什么我訂單上面要求開發票卻沒有發票?能把發票給我開了嗎?

2016-11-08 12:48:25
來自wangyuf**的評論:

這本挺好的...

2016-11-29 11:50:05
來自無昵稱**的評論:

這本書挺好的,發貨速度快,贊

2016-12-11 18:11:37
來自tianshi**的評論:

還行吧

2016-12-11 21:51:25
來自b***4(**的評論:

物流還挺快的。

2017-02-20 20:58:55
來自匿名用**的評論:

工作上可能要用,網上評論還好~

2017-03-09 22:37:56
來自g***b(**的評論:

不錯的一本專業書籍,最近在推廣數據倉庫的項目,希望在書中解疑釋惑。

2017-03-17 21:48:57
來自小***(**的評論:

東西很好,別人推薦的

2017-05-01 10:00:43
來自匿名用**的評論:

不錯不錯!正版,字跡清晰,很有幫助!

2017-06-12 22:02:18
來自匿名用**的評論:

質量不錯的

2017-06-28 20:31:34
來自m***k(**的評論:

包裝很好,很不錯的書,內容比較有用,案列較多,只是翻譯水平欠佳

2017-07-03 21:18:58
來自匿名用**的評論:

活動很給力,幫朋友買的

2017-08-02 10:57:08
來自waiting**的評論:

不錯,價格便宜,多次購買啦!希望多搞活動啊!

2017-08-10 23:01:10
來自無昵稱**的評論:

這本書寫的確實不錯 強烈推薦

2017-09-04 12:02:21
來自無昵稱**的評論:

沒看過原版,總覺得翻譯的很奇怪

2017-09-28 12:08:36
來自無昵稱**的評論:

翻譯太爛,懷疑譯者是不是唱戲的。

2017-11-03 08:29:41
來自無昵稱**的評論:

原著是本好書,可就是翻譯太爛太爛太爛了!!!很多語句都不通順,很生硬。嚴重懷疑翻譯者的態度和專業素質。

2017-09-16 16:23:30
來自華爾克**的評論:

這書其實是有干貨的,但是翻譯的實在是太差了,這算是直譯嗎? 讀的特別特別特別特別的晦澀。

2015-08-07 16:49:10
來自清涼甘**的評論:

這次包裝相當的好,送貨也快,就是這類書折扣不多。

2016-04-18 10:54:09
來自無昵稱**的評論:

很好很不錯,質量很不錯,發貨速度快,包裝很精美,快遞態度好

2016-04-22 15:07:08
來自我愛紫**的評論:

書很不錯,書是全新的的,紙質也很不錯,而且比其他網站的價格都便宜!

2016-05-31 22:00:04

免責聲明

更多出版社