大數據正在改變我們的世界。互聯網發展以及移動通信市場和相關技術的迅速擴張業已創建大量的數據,包括結構化數據和非結構化數據。數據可用性和數據應用對商業和更廣泛的社會領域帶來了巨大影響。有效使用大數據有助于公司更精準地對重要信息進行分析,最終提高運營效率、減少成本、降低風險、加快創新、增加收入。本書詳細介紹了大數據策略的規劃和執行,配以10個不同行業里不計其數的現實案例加以闡述。你將了解大數據的概念以及如何運用大數據——從計算投資回報率和促成商業案例到整體開發和具體項目的大數據策略。每一章都會解答關鍵問題,并給出你需要掌握的技能,以確保大數據項目成功。想要將大數據為自己和公司所用,請閱讀這本《大數據策略 如何成功使用大數據與10個行業案例分享》。
大數據時代 策略就是一切分析工具會隨著時間的推移而老化 但大數據策略將勝出知己知彼 百戰不殆 從了解各個行業案例開始大數據是每個高管都愿意掛在嘴邊的流行語卻幾乎無人知曉如何成功地應用大數據本書中可以找到答案!
如果沒有強有力的數據策略,即便存儲大量的數據或使用各種大數據工具,也無法幫助我們得到終的分析結果
帕姆•貝克(Pam Baker)是一位著名的商業分析師、科技自由撰稿人,以及在線出版刊物和電子雜志FierceBigData的編輯。她著作等身,文章經常刊登在不同的出版物上,包括《機構投資者》(Institutional Investor)雜志、CIO(印刷版)等。她以前曾擔任總部設在倫敦的VisionGain Research公司的簽約分析師。她實踐并撰寫了幾個知名的市場技術研究。她曾任研究員、作家以及總部設在紐約的市場研究公司ABI Research的執行主編。 鮑勃•格雷(Bob Gourley)是CTOvision.com網站的主編,也是技術研究和顧問公司Crucial Point LLC的創始人和首席技術官。他以前曾在美國國防部計算機網絡防御聯合特遣部隊JTF-CND擔任及時任情報總監和國防情報局首席技術官。格雷發表了40多篇文章,涉及主題廣泛,他也是Threats in the Age of Obama一書的特約作者。他的博客CTOvision被WashingtonTech網站評為美國技術類博客之一。
目 錄
第1章 何為真正的大數據 1
1.1 技術層面的定義 1
1.2 為什么數據規模無關緊要 4
1.3 大數據對管理層意味著什么 4
1.3.1 “大數據是萬能的” 4
1.3.2 “數據只是另一種電子表格” 5
1.4 大數據的執行方式 5
1.5 小結 10
第2章 如何制定成功的大數據策略 11
2.1 轉不出的死命循環 11
2.2 如何解開“誰是及時次”這個難題 13
2.2.1 改變大數據視角 13
2.2.2 用戶認知與數據采集 13
2.2.3 Facebook預測性分析的現實 14
2.2.4 Facebook數據收集走得更遠 15
2.2.5 使用Facebook坦誠認知大數據發展潛力 16
2.2.6 專業認知與大數據現實 16
2.2.7 從感知到認知偏差 17
2.2.8 尋找大數據占卜師 17
2.3 下一步:擁抱無知 19
2.4 始于何處 19
2.4.1 在結束時開始 20
2.4.2 當行動變為無為時 21
2.5 確認目標,瞄準目標 22
2.6 如何獲得實踐方法,讓落后觀念遠離前進的道路 24
2.6.1 解決人們對大數據的恐慌 24
2.6.2 終結未知的恐懼 24
2.6.3 接受改變,融入改變 25
2.6.4 機器統治并不確定,人類仍然起作用 26
2.6.5 接觸少數固執的人 26
2.7 回答沒人提出的問題 26
2.7.1 持續詢問可能性 27
2.7.2 尋找最終目標 27
2.8 與解說團隊交叉合作 28
2.8.1 為團隊增加業務分析師和關鍵終端用戶 28
2.8.2 為收集和管理數據增加首席數據官 29
2.9 小處著手、逐步發展并擴張 30
2.10 原型和迭代策略 31
2.11 談談向數據策略中添加預測分析 31
2.12 民主化數據,但預計幾乎無人使用(目前) 31
2.13 策略就是一個活的文檔;充實它、滋養它 32
2.14 小結 32
第3章 提出“正確”的問題 33
3.1 協作努力,提出問題 34
3.2 魔法8號球效應 35
3.3 用數學軟件來分析現實問題 36
3.4 “正確”問題的清單 36
3.5 小結 36
第4章 選擇“正確”數據源的方法 37
4.1 需要更多的數據源(數據類型)而非數據本身(數據容量) 37
4.2 為什么無論數據規模多大,生成的數據量都會不足且永遠不足 38
4.3 數據囤積與先捉再放 38
4.4 不可思議的大數據案例:購買尿布的狗主人 39
4.5 升級事務性數據的價值 39
4.6 社交媒體數據分析的局限性 40
4.7 大數據買賣的貨幣價值 40
4.8 利用黑客技術賺錢碰到麻煩 41
4.9 評估數據源 42
4.10 過時的模型招致競爭對手 42
4.11 購買數據時的考量 43
4.12 確定所需的外圍數據 43
4.13 談談結構化與非結構化數據 44
4.14 防止人為偏見對數據選擇的影響 46
4.15 數據孤島的危險 46
4.16 使用所需數據源的必要步驟 47
4.17 小結 48
第5章 解答大數據問題如同玩魔方 49
5.1 可行性數據的概念 49
5.2 描述性、預測性和規范性數據分析類型的差異 51
5.2.1 描述性數據分析 52
5.2.2 預測性數據分析 53
5.2.3 規范性數據分析 53
5.3 已有明確答案的問題 54
5.4 解釋會導致更多的問題 55
5.5 需要解讀的問題——魔方 55
5.6 小結 57
第6章 實時分析在動態化策略中的作用 59
6.1 檢查實時錯覺和時間膠囊 60
6.2 靜態策略與動態策略 61
6.3 談談轉向動態策略的變革管理 62
6.4 選擇分析方式 62
6.5 利用專家經驗,加速數據分析 65
6.6 實時分析來得太遲時該怎么辦 66
6.7 小結 66
第7章 大數據的價值主張和貨幣化 67
7.1 確定未知領域的投資回報率(ROI) 67
7.2 濫發的貨幣和模糊的投資回報率 69
7.3 成本核算的困惑 70
7.4 成本不是問題 71
7.5 先考慮大數據項目再談商業案例 71
7.6 計算實際成本 72
7.7 價值所在 73
7.7.1 從技術角度看待商業案例 73
7.7.2 從非技術角度看待商業案例 74
7.8 項目回報率的計算公式 74
7.9 重要問題:是否應該出售數據 76
7.9.1 銷售數據解析 77
7.9.2 物以稀為貴 77
7.10 小結 78
第8章 協同經濟的興起和盈利方式 79
8.1 數據等于知識和財富 79
8.2 大數據帶來的較大沖擊:顛覆原有模式 80
8.2.1 分享經濟 82
8.2.2 創客運動 83
8.2.3 合作創新 84
8.3 新模式在新協同經濟中興起 85
8.4 強調流暢性,摒棄靈活度 87
8.5 應用大數據制定戰略新模式 89
8.6 小結 90
第9章 隱私難題 91
9.1 真相揭開的那天預示著個人隱私神話的失敗 92
9.1.1 危險匯總 94
9.1.2 可在世界各地接聽的手機通話 94
9.1.3 公民和退伍軍人的數據如何幫助其他國家策劃襲擊 96
9.1.4 數據擴散逐步升級 97
9.1.5 為個人隱私畫一條底線 98
9.1.6 企業的隱私難題 101
9.2 數據收集中的4大轉變 102
9.2.1 數據入侵性改變 103
9.2.2 數據多樣性的改變 104
9.2.3 數據整合性的改變 105
9.2.4 數據作用范圍的改變 105
9.3 必須質疑的商業問題 110
9.4 誰是真正的數據擁有者 110
9.5 當前法律和措施在設定先例中的作用 111
9.6 授權允許的誤區 113
9.7 個人價值與混合數據 113
9.8 匿名數據的誤區 114
9.9 個人隱私與個人利益之間的平衡 115
9.10 數據收集何時會使你或你的公司承擔責任 115
9.11 商業價值的透明度 117
9.12 數據從業人員必須銘記的事實 118
9.13 小結 118
第10章 國防情報部門中的用例 119
10.1 態勢感知和可視化 120
10.2 信息相關性問題處理(“了解情況”問題) 121
10.3 海量數據中信息搜索和發現(“海底撈針”問題) 124
10.4 企業網絡安全數據管理 127
10.5 后勤信息(包括粗放型/動態性企業資產目錄) 127
10.6 加強衛生保健 127
10.7 開源信息 129
10.8 內存數據的現代化 130
10.9 企業數據中心 130
10.10 武器裝備與戰爭中的大數據用例 130
10.11 小結 131
第11章 政府大數據管理用例 133
11.1 大數據趨勢對政府數據的影響 134
11.2 聯合國“全球脈動”計劃用例 135
11.3 聯邦政府(非國防部或情報界)用例 137
11.4 州政府用例 139
11.5 當地政府用例 142
11.6 法律實施用例 144
11.7 小結 145
第12章 安全行業用例 147
12.1 一切都在互聯網上 147
12.2 亦敵亦友的數據 148
12.3 防病毒/反惡意軟件用例 149
12.4 目標如何擊中要害 151
12.5 虛擬和現實世界的碰撞 156
12.6 紛亂的機器數據 157
12.6.1 農民面臨的信息安全困境 157
12.6.2 物聯網中農民面臨的安全困境周而復始 158
12.7 當前和未來信息安全分析法 159
12.8 小結 162
第13章 醫療保健領域用例 163
13.1 解決抗生素危機 163
13.2 使用大數據治病 165
13.3 從谷歌到疾病預防控制中心 165
13.3.1 美國疾病預防控制中心(CDC)的糖尿病交互圖譜 168
13.3.2 項目數據領域 171
13.3.3 賽智生物網絡 172
13.4 另一方:生物黑客 173
13.5 電子健康記錄(EHR)、電子病歷(EMR)和大數據 175
13.6 公布醫療保健數據 176
13.7 小結 179
第14章 小企業和農場用例 181
14.1 大數據適用于小企業 181
14.2 炒作和真實世界局限性之間的界限 182
14.3 為工作選擇合適的工具 182
14.4 可能會使用的外部數據源示例 187
14.5 給使用共用或共享數據農民的一句忠告 192
14.5.1 說法一:數據屬于農民 193
14.5.2 說法二:數據只用于“幫助”農民從農場中更加受益 194
14.5.3 說法三:農民的數據將會保密 194
14.6 錢、錢、錢:大數據擴大借貸能力的方式 195
14.6.1 PayPal信貸 196
14.6.2 亞馬遜資本服務 196
14.6.3 數據驅動型貸款公司Kabbage 197
14.7 小結 197
第15章 交通運輸中的用例 199
15.1 加速發展大數據賺取利潤 199
15.1.1 美中不足的事 200
15.1.2 依靠數據獲勝不會長久 201
15.1.3 火車、飛機和船舶中的數據使用 201
15.2 車聯網:很可能不是你以為的那樣 203
15.2.1 數據引導創新和自動化 206
15.2.2 智能城市的崛起 206
15.2.3 正在發生的交通創新實例 207
15.3 數據和無人駕駛汽車 208
15.4 互聯的基礎設施 210
15.5 汽車保險品牌數據收集設備 212
15.6 交通領域無法預料的數據性 214
15.7 小結 215
第16章 能源領域中的用例 217
16.1 關于能源神話和假設的大數據 217
16.2 美國能源信息署(EIA)能源數據存儲庫 219
16.3 EIA能源數據表格瀏覽器 220
16.4 失蹤的智能電表數據 222
16.5 EIA的API和數據集 222
16.6 國際意義與合作 223
16.7 公私合作下的能源數據變革 224
16.8 公用事業用例 225
16.9 小結 227
第17章 零售業大數據用例 229
17.1 在大數據中重新運用老戰術 229
17.1.1 零售業沒搞砸,對象客戶發生了變化 231
17.1.2 品牌叛變和惡魔客戶 231
17.1.3 客戶體驗又成為一個問題 232
17.1.4 大數據與惡魔客戶復興 232
17.2 零售業與大數據博弈的原因 234
17.3 大數據幫助零售業的方式 234
17.3.1 產品選擇和定價 235
17.3.2 當前市場分析 236
17.3.3 利用大數據開發新的定價模式 236
17.3.4 尋找更好的方法獲取更多、更好和更清潔的客戶數據 237
17.3.5 研究和預測客戶接受度和反應 237
17.3.6 預測并規劃應對更廣泛的市場發展趨勢 241
17.4 預測零售業未來 243
17.5 小結 244
第18章 銀行和金融服務業用例 245
18.1 定義問題 245
18.2 銀行和貸款機構的用例 246
18.3 大數據如何在借貸領域點燃新競爭 248
18.4 新型可選擇貸款方式 248
18.4.1 貝寶(PayPal)貸款項目 248
18.4.2 人人貸和貸款俱樂部 249
18.5 零售商與銀行的較量;信用卡品牌規避銀行 250
18.6 征信局所面臨的大數據問題 250
18.7 談談保險公司 252
18.8 小結 254
第19章 制造業用例 255
19.1 經濟形式與機會展望 256
19.2 制造業的十字路口 258
19.3 3D打印與大數據的相交點 260
19.4 3D打印是如何影響制造業并擾亂客戶的 261
19.4.1 盈創公司24小時打印10所住宅 261
19.4.2 3D打印的景觀別墅 262
19.4.3 3D打印的傍水小宅 263
19.4.4 3D家庭打印對制造業的影響 263
19.5 增材制造的轉變將是巨大的,并會波及所有部門 263
19.6 個性化制造將如何改變一切,甚至創造更多的大數據 265
19.7 制造業內部新數據源涌出 266
19.8 此行業的用例 267
19.9 小結 267
第20章 下放權力 269
20.1 數據民主化 269
20.2 4步措施 270
20.3 其他4步 272
20.4 小結 273
第21章 摘要 275
21.1 何為真正的大數據 275
21.2 如何制定成功的大數據策略 276
21.3 提出“正確”的問題 276
21.4 選擇“正確”數據源的方法 277
21.5 解答大數據問題如同玩魔方 277
21.6 實時分析在動態化策略中的作用 278
21.7 大數據的價值主張和貨幣化 279
21.8 協同經濟的興起和盈利方式 279
21.9 隱私難題 280
21.10 政府大數據管理用例 280
21.11 國防情報部門中的用例 281
21.12 安全行業用例 282
21.13 醫療保健領域用例 282
21.14 小企業和農場用例 283
21.15 能源領域中的用例 284
21.16 交通運輸中的用例 285
21.17 零售業大數據用例 286
21.18 銀行和金融服務業用例 287
21.19 制造業用例 288
21.20 下放權力 289
第 1章 何為真正的大數據
似乎每個人都把大數據掛在嘴邊,甚至對許多人來說,大數據是需要考慮的頭等要務。
因此,有人認為,每個人都知道何為大數據。其實不然。盡管大數據有各種各樣技術上的
定義,但大多數人仍然不確定大數據的大小與常規數據庫的大小之間確切的界限。這給介
紹和探索大數據的發展,尤其是定義大數據項目參數帶來一定困難。
本章將探討對“大數據”概念的不同解讀。
1.1 技術層面的定義
大數據并不只是存儲規模從吉字節
gigabyte,GB)到太字節
terabyte,TB)的簡單的數
量級增長,盡管數據集仍如預期增長迅速,這一點將在下一章詳細闡述。更確切地講,大
數據是各類數據集合的匯總,包括一些結構化和非結構化數據,一些由物理數據源轉換為
在線數據集的數據集,以及事務型和非事務型數據庫。來源多種多樣,包括一些自產數
據和第三方數據。通常數據集的存儲模式存在差異,缺乏一致性。一般來說,大數據的
處理繁冗而復雜,支出明顯過高,即便并非行不通,現有的運算技術也很難支持大
數據計算。
此外,在技術上,數據集合達到何種規模才符合大數據標準尚未達成共識。而技術領
域內部更傾向于從描述數據特征、衡量數據規模、計算處理大規模數據量來定義大數據。
2001年美國
Gartner公司(原為
Meta集團)的一份報告中對大數據進行了定義,強調大
數據必須具備
3V特征,即容量大
Volume)、多樣化
Variety)和速度快
Velocity)。現在,有
機構在
3V之外又定義了第
4個“V”——真實性(Veracity),用以強調數據質量的重要性。
本質上,大數據是需要使用新工具來計算的任何規模的數據集。因此,大數據只是
好
很好
挺不錯的,有一定幫助
挺不錯的,有一定幫助
非常專業的一本書,需要仔細看
繼續加油
好評
一直在當當上買書,挺好!
書很好
想了解一下,特買來學學。
不錯不錯不錯
不錯價格便宜
這個商品很好
很好,正版的。
紙質和字體都不錯,內容也很好!
不錯不錯~
幫別人買的書
javascript:;
不錯不錯!正版,字跡清晰,很有幫助!
送人的,還不錯!
不錯的,內容很實用,看完很受益!
內容太虛了,沒有干貨!
還沒看,當下比較時髦的概念,充充電吧
可以了解一下大數據
很好的一本介紹大數據應用方面的書,不過寫的比較淺,對于想從事這行業的人來說,得學習更深的知識