大數(shù)據(jù)將打開各行各業(yè)的數(shù)據(jù)"潘多拉魔盒"。
社交網(wǎng)站、電商巨頭、電信運(yùn)營商乃至金融、醫(yī)療、教育等行業(yè),都將加入大數(shù)據(jù)的"淘金"熱潮,政府部門同樣會從大數(shù)據(jù)中獲益匪淺。如何將海量數(shù)據(jù)應(yīng)用于決策、營銷和產(chǎn)品創(chuàng)新?如何利用大數(shù)據(jù)平臺優(yōu)化產(chǎn)品、流程和服務(wù)?如何利用大數(shù)據(jù)更科學(xué)地制定公共政策、實(shí)現(xiàn)社會治理?所有這一切,都離不開大數(shù)據(jù)治理??梢哉f,在大數(shù)據(jù)戰(zhàn)略從頂層設(shè)計(jì)到底層實(shí)現(xiàn)的"落地"過程中,治理是基礎(chǔ),技術(shù)是承載,分析是手段,應(yīng)用是目的。桑尼爾·索雷斯的《大數(shù)據(jù)治理》的翻譯出版,正當(dāng)其時。
《大數(shù)據(jù)治理》一書較好地滿足了理解大數(shù)據(jù)治理框架的需要,系統(tǒng)地闡述了大數(shù)據(jù)治理的各個版塊,分析了五大類大數(shù)據(jù)的治理,考察了大數(shù)據(jù)治理在典型行業(yè)的實(shí)踐,并深入淺出地介紹了當(dāng)今主流的大數(shù)據(jù)技術(shù)與平臺。該書具有一定的可參照性、可操作性和可讀性,是大數(shù)據(jù)治理領(lǐng)域值得一讀的參考書。
桑尼爾·索雷斯的《大數(shù)據(jù)治理》是一個信息治理專家奉獻(xiàn)的鴻篇巨制,作者以極其實(shí)用和通俗易懂的風(fēng)格,傾心向讀者解讀大數(shù)據(jù)治理這一復(fù)雜主題。作為一家大公司的博學(xué)IT專家,我本人在面對數(shù)據(jù)窘境時,感覺不知所措。對數(shù)據(jù)領(lǐng)域的從業(yè)人員來說,面臨的問題多過答案。我所在的組織是南非的主導(dǎo)電信運(yùn)營商,我們擁有海量的電話詳單、位置數(shù)據(jù)和社交媒體生成的數(shù)據(jù)。要明智地使用數(shù)據(jù),就必須管理所有數(shù)據(jù)。本書匠心獨(dú)運(yùn),揭開了大數(shù)據(jù)的迷人景致,為我們應(yīng)對大數(shù)據(jù)領(lǐng)域的挑戰(zhàn),提供了必要的智力成果。
桑尼爾·索雷斯是信息資產(chǎn)公司LLC的創(chuàng)始人和執(zhí)行合伙人,LLC專注于幫助組織構(gòu)建信息治理計(jì)劃。曾任IBM的信息治理總監(jiān),合作客戶遍布六大洲和眾多行業(yè)。
除本書外,桑尼爾著有《IBM數(shù)據(jù)治理統(tǒng)程》、《說服企業(yè)實(shí)施信息治理:行業(yè)和工作職能實(shí)踐》兩書,前者被許多組織用作信息治理計(jì)劃的藍(lán)本,并被譯成中文。
匡斌,中國聯(lián)通研究院信息室/編輯部副主任、博士,具有16年電信行業(yè)從業(yè)經(jīng)驗(yàn)。專注于電信營銷、電信規(guī)制、電信運(yùn)營業(yè)新業(yè)態(tài)等領(lǐng)域的研究。
個人著譯:《電信營銷:理論精要》(編著)、《電信營銷:案例精選》(編著)、《競爭與混沌:1996年電信法出臺以來的美國電信業(yè)》(譯)。
電子郵件:kuaJlgbin69@vip.sina.com
及時部分 開篇
第1章 大數(shù)據(jù)治理概述
第2章 大數(shù)據(jù)治理的框架
2.1 大數(shù)據(jù)類型
2.2 信息治理準(zhǔn)則
2.3 大數(shù)據(jù)治理的產(chǎn)業(yè)和功能場景
第3章 成熟度評估
3.1 IBM信息治理委員會的成熟度模型
3.2 評估成熟度的示例問題
第4章 業(yè)務(wù)案例
4.1 通過大數(shù)據(jù)治理,提高運(yùn)營實(shí)時性和旅客安全度
4.2 量化大數(shù)據(jù)治理對客戶隱私的財(cái)務(wù)影響
4.3 通過治理大數(shù)據(jù)生命周期,降低IT成本
4.4 評估數(shù)據(jù)質(zhì)量和主數(shù)據(jù)對大數(shù)據(jù)計(jì)劃的影響
4.5 計(jì)算大數(shù)據(jù)質(zhì)量的價值
第5章 路線圖
5.1 路線圖案例研究
第二部分 大數(shù)據(jù)治理準(zhǔn)則
第6章 大數(shù)據(jù)治理的組織
6.1 繪制關(guān)鍵流程圖并建立職責(zé)分配模型,以識別大數(shù)據(jù)治理中的利益攸關(guān)者
6.2 確定新角色和既有角色的適當(dāng)組合
6.3 酌情任命大數(shù)據(jù)主管
6.4 在傳統(tǒng)信息治理角色的基礎(chǔ)上,酌情增加大數(shù)據(jù)責(zé)任
6.5 建立承擔(dān)包括大數(shù)據(jù)在內(nèi)的責(zé)任混合式信息治理組織
第7章 元數(shù)據(jù)
7.1 創(chuàng)建一個體現(xiàn)關(guān)鍵大數(shù)據(jù)術(shù)語的業(yè)務(wù)定義的詞庫
7.2 理解對ApacheHadoop中元數(shù)據(jù)的持續(xù)支持
7.3 對業(yè)務(wù)詞庫中的敏感大數(shù)據(jù)進(jìn)行標(biāo)記
7.4 從相關(guān)的大數(shù)據(jù)存儲中輸入技術(shù)元數(shù)據(jù)
7.5 將相關(guān)的數(shù)據(jù)源與業(yè)務(wù)詞庫中的術(shù)語進(jìn)行鏈接
7.6 使用運(yùn)營元數(shù)據(jù)監(jiān)測大數(shù)據(jù)的流動
7.7 保留技術(shù)元數(shù)據(jù),以支持?jǐn)?shù)據(jù)血統(tǒng)和影響分析
7.8 從非結(jié)構(gòu)化文件中采集元數(shù)據(jù),支持企業(yè)搜索
7.9 擴(kuò)展既有的元數(shù)據(jù)角色,將大數(shù)據(jù)納入其中
第8章 大數(shù)據(jù)隱私
8.1 識別敏感的大數(shù)據(jù)
8.2 對元數(shù)據(jù)庫中的敏感大數(shù)據(jù)進(jìn)行標(biāo)記
8.3 應(yīng)對國家、州(省)層面的隱私立法和隱私限制
8.4 管理個人數(shù)據(jù)跨國界流動的情況
8.5 監(jiān)控特權(quán)用戶對敏感大數(shù)據(jù)的訪問
第9章 大數(shù)據(jù)質(zhì)量
9.1 與商業(yè)上的利益攸關(guān)者協(xié)作,建立并測度大數(shù)據(jù)質(zhì)量的置信區(qū)間
9.2 利用準(zhǔn)結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù),提高人口稀疏的結(jié)構(gòu)化數(shù)據(jù)的質(zhì)量
9.3 使用流數(shù)據(jù)分析技術(shù)解決內(nèi)存中的數(shù)據(jù)質(zhì)量問題,無須將中間結(jié)果輸入硬盤
9.4 任命對信息治理委員會負(fù)責(zé)的數(shù)據(jù)主管,由其負(fù)責(zé)提高測度的質(zhì)量
第10章 業(yè)務(wù)流程整合
10.1 識別將會受到大數(shù)據(jù)治理影響的關(guān)鍵流程
10.2 建立關(guān)鍵活動的流程圖
10.3 針對業(yè)務(wù)流程中的關(guān)鍵步驟,制定大數(shù)據(jù)治理政策
第11章 主數(shù)據(jù)整合
11.1 提高主數(shù)據(jù)的質(zhì)量,以支持大數(shù)據(jù)分析
11.2 利用大數(shù)據(jù)提高主數(shù)據(jù)的質(zhì)量
11.3 提高關(guān)鍵參考數(shù)據(jù)的質(zhì)量和一致性,以支持大數(shù)據(jù)治理計(jì)劃
11.4 審視社交媒體平臺政策,以確定與主數(shù)據(jù)管理整合的程度
11.5 從非結(jié)構(gòu)化文本中挖掘有用信息,以豐富主數(shù)據(jù)
第12章 管理大數(shù)據(jù)的生命周期
12.1 基于規(guī)制和業(yè)務(wù)要求,擴(kuò)展保留時間表,將大數(shù)據(jù)包含其中
12.2 提供法律保留區(qū),并支持電子證據(jù)展示(eDiscovery)
12.3 壓縮大數(shù)據(jù)并將其存檔,降低IT成本,提高應(yīng)用績效
12.4 管理實(shí)時流數(shù)據(jù)的生命周期
12.5 保留社交媒體記錄,以符合規(guī)制要求,并支持電子證據(jù)展示
12.6 基于規(guī)制和業(yè)務(wù)要求,正當(dāng)合理地處置不再需要的大數(shù)據(jù)
第三部分 大數(shù)據(jù)的類型
第13章 Web和社交媒體數(shù)據(jù)
13.1 在制定有關(guān)客戶社交媒體數(shù)據(jù)的可接受使用的政策時,考慮不斷變化的規(guī)制和習(xí)俗
13.2 制定有關(guān)雇員和求職者社交媒體數(shù)據(jù)的可接受使用的政策
13.3 利用置信區(qū)間評估社交媒體數(shù)據(jù)的質(zhì)量
13.4 制定有關(guān)Cookies與其他Web跟蹤裝置的可接受使用的政策
13.5 在不侵犯隱私并遵從規(guī)制要求的基礎(chǔ)上,定義連接在線和離線數(shù)據(jù)的政策
13.6 確保網(wǎng)絡(luò)統(tǒng)計(jì)數(shù)據(jù)的一致性
第14章 機(jī)器對機(jī)器的數(shù)據(jù)
14.1 評估目前可用的地理位置數(shù)據(jù)
14.2 制定關(guān)于客戶地理位置數(shù)據(jù)的可接受使用的政策
14.3 制定關(guān)于雇員地理位置數(shù)據(jù)的可接受使用的政策
14.4 保障RFID數(shù)據(jù)的隱私安全
14.5 制定與其他類型M2M數(shù)據(jù)的隱私相關(guān)的政策
14.6 處理元數(shù)據(jù)和M2M數(shù)據(jù)的質(zhì)量問題
14.7 制定與M2M數(shù)據(jù)的保留期有關(guān)的政策
14.8 提高主數(shù)據(jù)的質(zhì)量,以支持M2M計(jì)劃
14.9 確保SCADA設(shè)施免遭網(wǎng)絡(luò)攻擊
第15章 大體量交易數(shù)據(jù)
第16章 生物計(jì)量學(xué)數(shù)據(jù)
16.1 評估與生物計(jì)量學(xué)數(shù)據(jù)的可接受使用相關(guān)的隱私含義
16.2 與法律顧問通力合作,確定演進(jìn)中的規(guī)制對使用客戶和雇員生物計(jì)量學(xué)數(shù)據(jù)的影響
第17章 人工生成的數(shù)據(jù)
17.1 制定屏蔽敏感的人工生成數(shù)據(jù)的政策
17.2 使用非結(jié)構(gòu)化的人工生成數(shù)據(jù),提高結(jié)構(gòu)化數(shù)據(jù)的質(zhì)量
17.3 管理人工生成數(shù)據(jù)的生命周期,降低成本并遵循規(guī)制要求
17.4 從非結(jié)構(gòu)化的人工生成數(shù)據(jù)中獲得洞察力,以豐富MDM
第四部分 行業(yè)視角
第18章 醫(yī)療保健機(jī)構(gòu)
18.1 利用非結(jié)構(gòu)化數(shù)據(jù),提高人口稀疏的結(jié)構(gòu)化數(shù)據(jù)的質(zhì)量
18.2 提取從結(jié)構(gòu)化數(shù)據(jù)中無法獲得的更多臨床因素
18.3 設(shè)定關(guān)鍵業(yè)務(wù)術(shù)語的一致性定義
18.4 確保跨科室的患者主數(shù)據(jù)的一致性
18.5 與美國HIPAA的規(guī)定一致,符合受保護(hù)的健康信息的隱私要求
18.6 創(chuàng)造性管理參考數(shù)據(jù),以獲得更多臨床洞察
第19章 公用事業(yè)部門
19.1 復(fù)制儀表讀數(shù)
19.2 主關(guān)鍵字的參照完整性
19.3 異常的儀表讀數(shù)
19.4 客戶地址的數(shù)據(jù)質(zhì)量
19.5 信息生命周期管理
19.6 數(shù)據(jù)庫監(jiān)測
19.7 技術(shù)架構(gòu)
第20章 通信服務(wù)提供商
20.1 大數(shù)據(jù)類型
20.2 將大數(shù)據(jù)與主數(shù)據(jù)進(jìn)行整合
20.3 大數(shù)據(jù)隱私
20.4 大數(shù)據(jù)質(zhì)量
20.5 大數(shù)據(jù)生命周期管理
第五部分 大數(shù)據(jù)技術(shù)
第21章 大數(shù)據(jù)的參考架構(gòu)
21.1 大數(shù)據(jù)源
21.2 開源基礎(chǔ)組件
21.3 Hadoop發(fā)行版
21.4 流數(shù)據(jù)分析
21.5 數(shù)據(jù)庫
21.6 大數(shù)據(jù)整合
21.7 文本分析
21.8 大數(shù)據(jù)發(fā)現(xiàn)
21.9 大數(shù)據(jù)質(zhì)量
21.10 大數(shù)據(jù)的元數(shù)據(jù)
21.11 信息政策管理
21.12 主數(shù)據(jù)管理
21.13 數(shù)據(jù)倉庫與數(shù)據(jù)集市
21.14 大數(shù)據(jù)分析與報(bào)告
21.15 大數(shù)據(jù)安全與隱私
21.16 大數(shù)據(jù)生命周期管理
21.17 云
第22章 大數(shù)據(jù)平臺
22.1 IBM
22.2 甲骨文
22.3 SAP
22.4 微軟
22.5 HP
22.6 Informatica
22.7 SAS
22.8 Teradata
22.9 EMC
22.10 Amazon
22.11 谷歌
22.12 Pentaho
22.13 Talend
附錄 縮略語列表
譯者后記
第1章大數(shù)據(jù)治理概述當(dāng)下,數(shù)據(jù)正在將我們淹沒。蔚為壯觀的數(shù)據(jù),來自于社交媒體、電話GPS信號、公用事業(yè)智能儀表、RFID標(biāo)簽、數(shù)字圖片和其他數(shù)據(jù)源中的在線視頻。
IDC宣稱,2011年,數(shù)字世界的信息量超過1.8ZB(澤字節(jié),1.8億GB),預(yù)計(jì)將以每兩年翻番的速度增長。
大部分?jǐn)?shù)據(jù)可視為大數(shù)據(jù)。談到大數(shù)據(jù),通常以"3V"——體量(Volume)、速度(Velocity)和多樣性(Variety)概括其特征。我們增加了一個"V"(Value),代表數(shù)據(jù)的價值。以下是對這四個特征的簡單描述:體量(數(shù)據(jù)的靜態(tài)描述)。大數(shù)據(jù)通常具有較大體量。企業(yè)被數(shù)據(jù)堆砌,很容易積攢TB(太字節(jié))級和PB(拍字節(jié))級的信息,甚至在將來可輕易積攢ZB級的信息。
速度(數(shù)據(jù)的動態(tài)描述)。通常具有時間敏感性,流數(shù)據(jù)的分析必須以毫秒計(jì),以支撐實(shí)時決策。
多樣性(數(shù)據(jù)的多格式化)。大數(shù)據(jù)包括結(jié)構(gòu)化數(shù)據(jù)、準(zhǔn)結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),如電子郵件、音頻、視頻、點(diǎn)擊流、日志文檔和生物計(jì)量學(xué)數(shù)據(jù)。
價值(數(shù)據(jù)的經(jīng)濟(jì)有效性)。組織正在努力以經(jīng)濟(jì)有效的方式從大數(shù)據(jù)中獲得洞察力。這正是ApacheHadoop等開源技術(shù)大行其道的原因所在。本書后續(xù)章節(jié)中詳細(xì)介紹的Hadoop,是一種以經(jīng)濟(jì)有效的方式處理成百上千臺計(jì)算機(jī)中的大數(shù)據(jù)集的軟件。
組織必須治理全部大數(shù)據(jù),由此引出了本書的主題。我們將大數(shù)據(jù)治理定義如下:大數(shù)據(jù)治理是廣義信息治理計(jì)劃的一部分,即制定與大數(shù)據(jù)有關(guān)的數(shù)據(jù)優(yōu)化、隱私保護(hù)與數(shù)據(jù)變現(xiàn)的政策。
我們將上述大數(shù)據(jù)治理的定義分解為以下部分:(1)大數(shù)據(jù)是廣義信息治理計(jì)劃的一部分。信息治理機(jī)構(gòu)必須采取以下措施,以將大數(shù)據(jù)整合到既有的信息治理框架中:擴(kuò)展信息治理憲章的外延,將大數(shù)據(jù)治理納入其中;拓寬信息治理委員會成員的范圍,將數(shù)據(jù)科學(xué)家等大數(shù)據(jù)的超級用戶吸納進(jìn)來;任命處理社交媒體等特定大數(shù)據(jù)的主管;將大數(shù)據(jù)與元數(shù)據(jù)、隱私、數(shù)據(jù)質(zhì)量和主數(shù)據(jù)等信息治理準(zhǔn)則結(jié)合。
(2)大數(shù)據(jù)治理關(guān)乎政策制定。政策包括人們在特定情形下如何作為的成文和非成文的宣告。譬如,大數(shù)據(jù)治理政策可能申明,未經(jīng)顧客知情并同意,組織不得將顧客的Facebook資料整合到其主數(shù)據(jù)記錄中。
(3)大數(shù)據(jù)必須優(yōu)化。考慮一下組織是如何將現(xiàn)實(shí)世界的準(zhǔn)則應(yīng)用到大數(shù)據(jù)治理中的。公司設(shè)計(jì)了精致的企業(yè)資產(chǎn)管理計(jì)劃,對機(jī)器、飛機(jī)、交通工具和其他資產(chǎn)進(jìn)行妥善管理。與對實(shí)物資產(chǎn)進(jìn)行登記類似,組織必須對大數(shù)據(jù)進(jìn)行如下優(yōu)化:元數(shù)據(jù)——建立大數(shù)據(jù)類別信息數(shù)據(jù)質(zhì)量管理——像公司對實(shí)物資產(chǎn)進(jìn)行定期檢修一樣,定期凈化大數(shù)據(jù)。
信息生命周期管理——對大數(shù)據(jù)進(jìn)行存檔,并在沒必要繼續(xù)保存某些數(shù)據(jù)時,將其刪除。
(4)大數(shù)據(jù)隱私至關(guān)重要。組織同樣必須建立旨在防止大數(shù)據(jù)誤用的適當(dāng)政策。組織在處理社交媒體、地理定位、生物計(jì)量學(xué)和其他形式的個人可識別信息(PII)時,必須考慮涉及的聲譽(yù)、規(guī)制和法律風(fēng)險。
(5)大數(shù)據(jù)必須變現(xiàn)。所謂變現(xiàn),就是將數(shù)據(jù)等資產(chǎn)轉(zhuǎn)化為現(xiàn)金的過程,變現(xiàn)的方式可以是將數(shù)據(jù)賣給第三方,也可以是利用數(shù)據(jù)開發(fā)新的服務(wù)。在傳統(tǒng)的會計(jì)準(zhǔn)則下,不允許公司在平衡報(bào)表中將信息視同為財(cái)務(wù)資產(chǎn),除非信息是從外部來源購買的。盡管傳統(tǒng)的會計(jì)處理趨于保守,但在當(dāng)下,公司意識到,必須將大數(shù)據(jù)視為具有財(cái)務(wù)價值的企業(yè)資產(chǎn)。例如,運(yùn)營部門可以通過傳感器數(shù)據(jù),根據(jù)定期檢修計(jì)劃,提高設(shè)備正常運(yùn)行時間。呼叫中心可以分析客戶代表的記錄,通過了解顧客呼叫的原因,降低呼叫量。此外,零售商可以使用主數(shù)據(jù)激活Facebook的應(yīng)用程序,提升顧客忠誠度。
……P3-5
大數(shù)據(jù)涉及不同來源的復(fù)雜數(shù)據(jù)。倘若缺乏得當(dāng)?shù)臄?shù)據(jù)治理,那就很難正確地整合數(shù)據(jù)。《大數(shù)據(jù)治理》一書為您提供了制定大數(shù)據(jù)治理計(jì)劃所必須的信息和見識,而大數(shù)據(jù)治理計(jì)劃是支持大數(shù)據(jù)整合項(xiàng)目不可或缺的。好樣的,桑尼爾!
——Symphony IRI Group技術(shù)研究副總裁
杰·猶斯科 博士
本書是一個信息治理專家奉獻(xiàn)的鴻篇巨制,作者以極其實(shí)用和通俗易懂的風(fēng)格,傾心向讀者解讀大數(shù)據(jù)治理這一復(fù)雜主題。
作為一家大公司的博學(xué)IT專家,我本人在面對數(shù)據(jù)窘境時,感覺不知所措。對數(shù)據(jù)領(lǐng)域的從業(yè)人員來說,面臨的問題多過答案。我所在的組織是南非的主導(dǎo)電信運(yùn)營商,我們擁有海量的電話詳單、位置數(shù)據(jù)和社交媒體生成的數(shù)據(jù)——要明智地使用數(shù)據(jù),就必須管理所有數(shù)據(jù)。
本書匠心獨(dú)運(yùn),揭開了大數(shù)據(jù)的迷人景致,為我們應(yīng)對大數(shù)據(jù)領(lǐng)域的挑戰(zhàn),提供了必要的智力成果。
本書的字里行間,流淌著豐富的信息。如今,我終于有機(jī)會將本書所述的理念和知識融會貫通。我更有信心應(yīng)對公司面臨的大數(shù)據(jù)挑戰(zhàn),對此,我滿懷熱枕,決心已定。 大數(shù)據(jù)涉及不同來源的復(fù)雜數(shù)據(jù)。倘若缺乏得當(dāng)?shù)臄?shù)據(jù)治理,那就很難正確地整合數(shù)據(jù)?!洞髷?shù)據(jù)治理》一書為您提供了制定大數(shù)據(jù)治理計(jì)劃所必須的信息和見識,而大數(shù)據(jù)治理計(jì)劃是支持大數(shù)據(jù)整合項(xiàng)目不可或缺的。好樣的,桑尼爾!
——Symphony IRI Group技術(shù)研究副總裁
杰·猶斯科 博士
本書是一個信息治理專家奉獻(xiàn)的鴻篇巨制,作者以極其實(shí)用和通俗易懂的風(fēng)格,傾心向讀者解讀大數(shù)據(jù)治理這一復(fù)雜主題。
作為一家大公司的博學(xué)IT專家,我本人在面對數(shù)據(jù)窘境時,感覺不知所措。對數(shù)據(jù)領(lǐng)域的從業(yè)人員來說,面臨的問題多過答案。我所在的組織是南非的主導(dǎo)電信運(yùn)營商,我們擁有海量的電話詳單、位置數(shù)據(jù)和社交媒體生成的數(shù)據(jù)——要明智地使用數(shù)據(jù),就必須管理所有數(shù)據(jù)。
本書匠心獨(dú)運(yùn),揭開了大數(shù)據(jù)的迷人景致,為我們應(yīng)對大數(shù)據(jù)領(lǐng)域的挑戰(zhàn),提供了必要的智力成果。
本書的字里行間,流淌著豐富的信息。如今,我終于有機(jī)會將本書所述的理念和知識融會貫通。我更有信心應(yīng)對公司面臨的大數(shù)據(jù)挑戰(zhàn),對此,我滿懷熱枕,決心已定。
拜桑尼爾在本書中提供的指南所賜,我們所有數(shù)據(jù)從業(yè)人員都將獲得成功!
——南非電信數(shù)據(jù)治理辦公室主任
柯馬林·伽迪
可以說,在大數(shù)據(jù)戰(zhàn)略從頂層設(shè)計(jì)到底層實(shí)現(xiàn)的"落地"過程中,治理是基礎(chǔ),技術(shù)是承載,分析是手段,應(yīng)用是目的?!洞髷?shù)據(jù)治理》一書的翻譯出版,正當(dāng)其時。
相信在可預(yù)見的將來,經(jīng)過循序漸進(jìn)的治理,大數(shù)據(jù)將成為重要的國家資源和企業(yè)的核心生產(chǎn)要素。大數(shù)據(jù)將給中國的政府、企業(yè)和其它組織,帶來切切實(shí)實(shí)的收益。
——工業(yè)和信息化部軟件服務(wù)業(yè)司司長 陳偉教授
大數(shù)據(jù)的淘金之旅,需要腳踏實(shí)地的努力。大數(shù)據(jù)治理是連接大數(shù)據(jù)科學(xué)和應(yīng)用的橋梁,若要到達(dá)風(fēng)光無限的大數(shù)據(jù)彼岸,大數(shù)據(jù)治理一定是"必修課"之一。
大數(shù)據(jù)的思想啟蒙運(yùn)動正在開始,從大數(shù)據(jù)治理起步,不斷探索這個領(lǐng)域的產(chǎn)權(quán)、法律和交易等問題,才能成為進(jìn)入大數(shù)據(jù)世界的先行者。
——寬帶資本董事長 田溯寧博士
2013年,IBM在全球進(jìn)行了5次有關(guān)大數(shù)據(jù)的調(diào)研,發(fā)現(xiàn):超過2/3的企業(yè)正在使用大數(shù)據(jù)分析來支持企業(yè)創(chuàng)收策略;近40%的企業(yè)在采納大數(shù)據(jù)分析后的6個月內(nèi),就看到了快速的投資回報(bào)(ROI)。
大數(shù)據(jù)治理是大數(shù)據(jù)分析的基礎(chǔ)。本書梳理了大數(shù)據(jù)治理的各個方面,分享了全球很多經(jīng)典案例,對于企業(yè)充分利用大數(shù)據(jù)幫助創(chuàng)造新的市場機(jī)會,有很大借鑒意義。
——IBM全球副總裁兼IBM軟件集團(tuán)大中華區(qū)總經(jīng)理 胡世忠