當(dāng)下,大數(shù)據(jù)是一個(gè)熱門的話題,很多領(lǐng)域的學(xué)者,從不同的角度進(jìn)行了深入的討論。本書從大數(shù)據(jù)的歷史、內(nèi)涵、哲學(xué)和技術(shù)四個(gè)角度,解析大數(shù)據(jù),讓讀者對(duì)大數(shù)據(jù)有更深入的了解。 《品味大數(shù)據(jù)》共11章,大致分為4塊:第1-3章主要漫談了大數(shù)據(jù)的有趣的歷史,包括數(shù)據(jù)的啟蒙、信息載體的演變和數(shù)據(jù)管理的發(fā)展脈絡(luò)。第4-6章主要聊聊大數(shù)據(jù)的內(nèi)涵,包括大數(shù)據(jù)與哲學(xué)及第四科學(xué)范式的關(guān)聯(lián)。第7-9張是大數(shù)據(jù)的雜談,包括大數(shù)據(jù)的用途、可能面臨的陷阱以及通過小故事對(duì)大數(shù)據(jù)進(jìn)行一些煩死,第10-11章主要涉及大數(shù)據(jù)的技術(shù),包括100余篇大數(shù)據(jù)論文的漫讀及Hadoop的初級(jí)實(shí)戰(zhàn)篇。
品味大數(shù)據(jù)》與市面上圖書不同的是從多維度對(duì)大數(shù)據(jù)的歷史、內(nèi)涵、哲學(xué)與技術(shù)四個(gè)方面對(duì)大數(shù)據(jù)進(jìn)行了深入的探討,用百位大牛的觀點(diǎn)論辯來幫助讀者形成自己的大數(shù)據(jù)認(rèn)知體系。
圖書行文幽默、結(jié)構(gòu)完整、圖文并茂通俗易懂,讓讀者寓學(xué)于樂。
率先采用正反辯論的方法對(duì)觀點(diǎn)形成闡述,讓讀者可以從辯證的角度去品味大數(shù)據(jù)。
張玉宏 留美博士,曾跟隨導(dǎo)師Alok Choudhary教授參加了奧巴馬總統(tǒng)辦公室有關(guān)Big Data(大數(shù)據(jù))研討會(huì)。
張玉宏 / 在路上,學(xué)而時(shí)習(xí)之 序
及時(shí)章 大數(shù)據(jù)簡(jiǎn)史漫談之一——數(shù)字的來源及數(shù)據(jù)思維的發(fā)展
人類的“數(shù)覺”與計(jì)數(shù)系統(tǒng) 1.1
1.2 關(guān)于二進(jìn)制的一點(diǎn)討論
數(shù)字的誕生與廣泛應(yīng)用的匹配法 1.3
數(shù)學(xué)的“問世”與“算法”的祖師爺 1.4
文字的“出爐”與羅馬語言的來歷 1.5
古代的數(shù)據(jù)保存之道與文言文的“無奈”精簡(jiǎn) 1.6
古代的“數(shù)據(jù)中心”——圖書館 1.7
古代計(jì)算工具的誕生及其演變 1.8
1.9 統(tǒng)計(jì)學(xué)誕生——數(shù)據(jù)思維的漸起
美國(guó)式的人口普查——大數(shù)據(jù)催生新技術(shù) 1.10
1.11 中國(guó)式的人口統(tǒng)計(jì)與數(shù)目字管理
本章小結(jié)與思考 1.12
大數(shù)據(jù)簡(jiǎn)史漫談之二——近代存儲(chǔ)體系發(fā)展中的那些人和事 第二章
2.1 數(shù)據(jù)復(fù)制與傳播中的問題及解決方案
影響人類發(fā)展進(jìn)程的幾次能源革命 2.2
2.3 不能遺忘的電氣時(shí)代的傳奇——特斯拉
霍爾瑞斯的穿孔卡 2.4
2.5 現(xiàn)代通用計(jì)算機(jī)的奠基者——圖靈和馮 諾伊曼
波弗勞姆的磁帶發(fā)明 2.6
華人王安電腦的磁芯存儲(chǔ)器 2.7
IBM 的傳奇磁存儲(chǔ)世界 2.8
網(wǎng)絡(luò)存儲(chǔ)世界的興起 2.9
2.10 本章小結(jié)與思考
大數(shù)據(jù)簡(jiǎn)史漫談之三——數(shù)據(jù)庫的發(fā)展與大數(shù)據(jù)的興起 第三章
3.1 近代“數(shù)據(jù)中心”之夢(mèng)殤
“窮”則思變之網(wǎng)狀數(shù)據(jù)庫 3.2
濃墨重彩之關(guān)系數(shù)據(jù)庫 3.3
突破數(shù)據(jù)共享封鎖線的領(lǐng)頭人 3.4
高手對(duì)決的數(shù)據(jù)倉庫領(lǐng)域兩俠客 3.5
向非結(jié)構(gòu)化進(jìn)發(fā)的數(shù)據(jù)大趨勢(shì) 3.6
大數(shù)據(jù)術(shù)語的歷史淵源 3.7
現(xiàn)代大數(shù)據(jù)的誕生 3.8
3.9 在混沌和秩序轉(zhuǎn)化中螺旋上升
本章小結(jié)與思考 3.10
第四章 大數(shù)據(jù)的內(nèi)涵
從數(shù)據(jù)、信息到知識(shí)、智慧的飛躍 4.1
大數(shù)據(jù)的多版本定義 4.2
4.3 大數(shù)據(jù)——新時(shí)代的生產(chǎn)資料
信息(數(shù)據(jù))化、第二經(jīng)濟(jì)與數(shù)據(jù)思維的轉(zhuǎn)變 4.4
4.5 大數(shù)據(jù)——來自學(xué)術(shù)界的青睞
大數(shù)據(jù)——來自政府層面的重視 4.6
大數(shù)據(jù)——來自工商業(yè)的熱捧 4.7
大數(shù)據(jù)內(nèi)涵——“豈止于大” 4.8
大數(shù)據(jù)之“大”有不同(Volume) 4.8.1
大數(shù)據(jù)之唯“快”不破(Velocity) 4.8.2
大數(shù)據(jù)之五彩繽紛(Variety) 4.8.3
大數(shù)據(jù)之價(jià)“值”無限(Value) 4.8.4
包括但不限于 4V 4.8.5
4.9 本章小結(jié)與思考
大數(shù)據(jù)時(shí)代的一點(diǎn)哲學(xué)思考 第五章
5.1 哲學(xué)與科學(xué)的關(guān)系——為什么計(jì)算機(jī)專業(yè)博士也發(fā)個(gè)哲學(xué)文憑(Ph.D)
大、小數(shù)據(jù)的“質(zhì)”不同 5.2
5.3 大數(shù)據(jù)的數(shù)理哲學(xué)基礎(chǔ)——同構(gòu)關(guān)系
大數(shù)據(jù)認(rèn)識(shí)主體的變化——“替人消災(zāi)”式的認(rèn)識(shí)能免責(zé)嗎 5.4
5.5 波普爾的世界 3——秦始皇的長(zhǎng)生夢(mèng),找錯(cuò)了空間
大數(shù)據(jù)認(rèn)識(shí)對(duì)象的變化——提升普羅大眾的權(quán)重 :“長(zhǎng)尾理論” 5.6
認(rèn)識(shí)論對(duì)大數(shù)據(jù)研究的指導(dǎo)意義 5.7
科學(xué)始于觀察——證實(shí)主義 5.7.1
證實(shí)主義的困頓——來自波普爾的批判 5.7.2
科學(xué)始于問題——波普爾的貢獻(xiàn) 5.7.3
科學(xué)始于數(shù)據(jù)——大數(shù)據(jù)時(shí)代的科學(xué)轉(zhuǎn)機(jī)與思考 5.7.4
大數(shù)據(jù)的悲觀思潮 5.7.5
本章小結(jié)與思考 5.8
大數(shù)據(jù)研究的第四范式 第六章
6.1 谷歌公司的“不務(wù)正業(yè)”
塞吉 布林的“秘密”病情 6.2
布林病情的“治療”方案 6.3
詹姆斯 格雷的科學(xué)第四范式 6.4
科學(xué)研究的其他三個(gè)范式 6.5
6.6 本章小結(jié)與思考
大數(shù)據(jù),大有為 第七章
洞察帶來價(jià)值 7.1
7.2 案例 1 :谷歌是如何“越俎代庖”地預(yù)測(cè)流感的
流感治療網(wǎng)絡(luò)化 7.2.1
“無意間”生產(chǎn)的搜索數(shù)據(jù) 7.2.2
谷歌工程師們的杰作——流感預(yù)測(cè)趨勢(shì)(GFT) 7.2.3
谷歌的“越俎代庖”為何成功 7.2.4
案例小結(jié) :數(shù)據(jù)、模型與理論 7.2.5
7.3 案例 2 :“全數(shù)據(jù)”是如何為葉詩文抱不平的
葉詩文事件的新聞背景 7.3.1
什么是性能分析法 7.3.2
質(zhì)疑的合理性在哪里 7.3.3
“大數(shù)據(jù) = 全數(shù)據(jù)”的威力——為葉詩文抱不平 7.3.4
案例小結(jié) 7.3.5
案例 3 :大數(shù)據(jù)是如何對(duì)抗癌癥的 7.4
7.4.1 癌癥大數(shù)據(jù)的特征是什么
癌癥從哪里來 7.4.2
大數(shù)據(jù)用之于癌癥斗爭(zhēng),挑戰(zhàn)何在 7.4.3
癌癥診療的基礎(chǔ)大數(shù)據(jù)——獲取難 7.4.4
數(shù)據(jù)化帶來的顛覆式醫(yī)療——執(zhí)行難 7.4.5
哪些機(jī)構(gòu)在用大數(shù)據(jù)對(duì)抗癌癥 7.4.6
癌癥大數(shù)據(jù)的重要源頭——基因組數(shù)據(jù) 7.4.7
大數(shù)據(jù)對(duì)抗癌癥,前景如何 7.4.8
案例小結(jié) 7.4.9
更多大數(shù)據(jù)應(yīng)用案例 7.5
7.6 本章小結(jié)與思考
大數(shù)據(jù)之坑與小數(shù)據(jù)之美 第八章
引子——哪個(gè) V 8.1 才是大數(shù)據(jù)最重要的特征
“大”有不同——Volume(大量) 8.1.1
8.1.2 數(shù)據(jù)共征——Velocity(快速)與 Value(價(jià)值)
五彩繽“紛”——Variety(多樣) 8.1.3
大數(shù)據(jù)的力量與陷阱 8.2
大數(shù)據(jù)的力量 8.2.1
大數(shù)據(jù)的陷阱 8.2.2
今日王謝堂前燕,暫未飛入百姓家——大數(shù)據(jù)還沒那么普及 8.2.3
8.2.4 你若安好,便是晴天——小數(shù)據(jù)之美
本章小結(jié)與思考 8.3
12 第九章 個(gè)小故事,思考大數(shù)據(jù)
故事 1 :大數(shù)據(jù)都是騙人的啊——大數(shù)據(jù)預(yù)測(cè)得準(zhǔn)嗎 9.1
故事 2 9.2 :顛簸的街道——對(duì)不起,“n=all”只是一個(gè)幻覺
故事 3 :醉漢路燈下找鑰匙——大數(shù)據(jù)的研究方法可笑嗎 9.3
故事 4 :園中有金不在金——大數(shù)據(jù)的價(jià)值 9.4
故事 5 9.5 :蓋洛普抽樣的成功——大小之爭(zhēng),“大”數(shù)據(jù)一定勝過小抽樣嗎
故事 6 :點(diǎn)球成金——數(shù)據(jù)流 PK 9.6 球探,誰更重要
故事 7 :啤酒和尿布——經(jīng)典故事是偽造的,你知道嗎 9.7
故事 8 9.8 :谷歌流感預(yù)測(cè)——預(yù)測(cè)是如何失效的
故事 9 :Target 超市預(yù)測(cè)女孩懷孕——“大數(shù)據(jù)”智慧,還是愚蠢 9.9
故事 10 :你的一夜情我知道——大數(shù)據(jù)的隱私之痛 9.10
故事 11 9.11 . :大數(shù)據(jù),無須懼——比薩店員更能知道顧客所有的信息嗎
故事 12 9.12 :撲朔離迷的“因果關(guān)系”——蘇格拉底的“詭辯術(shù)”
本章小結(jié)與思考 9.13
第十章 大數(shù)據(jù)技術(shù)漫談——需要讀懂的 100 篇大數(shù)據(jù)文獻(xiàn)
大數(shù)據(jù)價(jià)值的實(shí)現(xiàn) 10.1
10.2 大數(shù)據(jù)分析的關(guān)鍵架構(gòu)層
架構(gòu)的演進(jìn) 10.3
幾個(gè)重要的概念 10.4
10.5 文件系統(tǒng)層
數(shù)據(jù)存儲(chǔ)層 10.6
Managers) 資源管理器層(Resource 10.7
調(diào)度器(Schedulers) 10.8
協(xié)調(diào)器(Coordination) 10.9
Frameworks) 計(jì)算框架(Computational 10.10
10.11 Analysis) 數(shù)據(jù)分析層(Data
Integration) 數(shù)據(jù)集成層(Data 10.12
Frameworks) 操作框架層(Operational 10.13
10.14 本章小結(jié)與思考
牛刀小試之 Hadoop 實(shí)戰(zhàn) 第十一章
什么是 Hadoop 11.1
Hadoop 發(fā)展歷程 11.2
Hadoop 集群服務(wù)器的安裝與配置 11.3
7 安裝 CentOS 11.3.1
配置 Java 環(huán)境 11.3.2
11.3.3 啟動(dòng)和配置 SSH 服務(wù)
安裝 Hadoop 11.3.4
啟動(dòng) 11.3.5 Hadoop
World 版 Hadoop 程序——WordCount 運(yùn)行 Hello 11.4
11.5 全分布模式下的 Hadoop 集群構(gòu)建
Linux 以運(yùn)行等級(jí) 3 啟動(dòng) 11.5.1
在 11.5.2 OS 環(huán)境下克隆虛擬機(jī) Windows 和 Mac
設(shè)置靜態(tài) IP 地址 11.5.3
修改 11.5.4 hosts 文件
虛擬機(jī)的同步配置 11.5.5
SSH 的免密碼登錄 11.5.6
全分布模式下安裝 Hadoop 11.5.7
同步配置文件 11.5.8
11.5.9 創(chuàng)建所需目錄
關(guān)閉防火墻 11.5.10
格式化文件系統(tǒng) 11.5.11
11.5.12 啟動(dòng) Hadoop 守護(hù)進(jìn)程
驗(yàn)證全分布模式 11.5.13
默認(rèn)配置文件所在位置 11.5.14
關(guān)閉 Hadoop 11.5.15
Hadoop 的運(yùn)行錯(cuò)誤查找 11.5.16
WordCount 代碼詳解 11.6
MapReduce 編程模型 11.6.1
WordCount 的 MapReduce 處理流程 11.6.2
WordCount 源碼解讀 11.6.3
本章小結(jié)與思考 11.7
記 后
5.2 大、小數(shù)據(jù)的“質(zhì)”不同
大數(shù)據(jù)的實(shí)質(zhì)是什么?在第四章中,我們已經(jīng)討論過這個(gè)議題。雖然當(dāng)前學(xué)術(shù)界和實(shí)業(yè)界對(duì)此都還沒有一個(gè)統(tǒng)一的定義或認(rèn)知,但從狹義的字面來理解的話,它應(yīng)該與小數(shù)據(jù)相對(duì)應(yīng),大數(shù)據(jù)是指數(shù)據(jù)量特別巨大,超出了常規(guī)的處理能力,需要引入新的科學(xué)工具和技術(shù)手段,方能夠進(jìn)行處理的數(shù)據(jù)集合。
于此對(duì)應(yīng)的,所謂的小數(shù)據(jù)指的是,數(shù)據(jù)規(guī)模比較小,用傳統(tǒng)的工具和方法就足以完成處理的數(shù)據(jù)集合。下面我們用一段天文學(xué)家第谷 布拉赫和約翰尼斯 開普勒的故事來舉例說明小數(shù)據(jù)的應(yīng)用。
在16 世紀(jì),有位杰出的占星學(xué)家、天文學(xué)學(xué)家,名叫第谷 布拉赫(TychoBrahe,1546—1601)。第谷出生于丹麥的一個(gè)貴族家庭。早在1572 年,第谷憑借自己出色的觀察能力,發(fā)現(xiàn)仙后座中的一顆新星,后來受惜才的普魯士國(guó)王腓特烈二世(Friedrich Ⅱ)b 的邀請(qǐng),他在汶島建造天堡觀象臺(tái),經(jīng)過20 年的觀測(cè),發(fā)現(xiàn)了許多新的天文現(xiàn)象。第谷是天文史上的一位奇人。他對(duì)于星象所做的觀測(cè)精度之高,是他同時(shí)代的人望塵莫及的,他編纂的星表的數(shù)據(jù)甚至接近了肉眼分辨率的極限。
1597 年, 有位才華橫溢的年輕人約翰尼斯 開普勒(Johannes Kepler,1571—1630)漸露頭角,年僅26 歲的他出版了自己對(duì)宇宙模型猜想的著作——《神秘的宇宙》(Mysterium Cosmographicum)。在這本書中,開普勒設(shè)計(jì)了一個(gè)非常有趣的、由許多有規(guī)則的幾何形體構(gòu)成的宇宙模型。
1599 年,第谷看到這本書,十分欣賞開普勒的智慧和才能,立即誠邀他做自己的助手。開普勒來到第谷身邊以后,師徒二人“珠聯(lián)璧合”,朝夕相處,對(duì)天文學(xué)領(lǐng)域共同的狂熱,讓他們結(jié)成忘年交。
但是,好景不長(zhǎng),開普勒受多疑的妻子的挑唆,突然和第谷決裂,不辭而別。開普勒的離去,使愛才如命的第谷非常傷心。他意識(shí)到這是一種誤會(huì),立即寫信給開普勒解釋,并胸懷寬廣地請(qǐng)他回來繼續(xù)合作。開普勒讀了第谷的誠摯來信,感到十分愧疚。當(dāng)兩人重修舊時(shí),第谷不記舊怨,不但把才華出眾的開普勒推薦給國(guó)王腓特烈二世,還把自己20 多年辛勤工作積累下來的觀測(cè)資料和手稿,全部交給開普勒使用。他對(duì)開普勒說:“除了火星所給予你的麻煩之外,其他一切麻煩都沒有了?,F(xiàn)在我把火星的研究也要交托于你,它夠你一個(gè)人麻煩的了。”
開普勒在接手第谷觀測(cè)的數(shù)據(jù)后,這批花費(fèi)第谷20 多年時(shí)間得到的數(shù)據(jù),很快就在開普勒手中“妙筆生花”,開普勒經(jīng)過手工計(jì)算,從中發(fā)現(xiàn)了著名的“行星運(yùn)動(dòng)三大定律”,即軌道定律、面積定律和周期定律。這三大定律最終使開普勒贏得了“天空立法者”的美名。開普勒的成就,來自堅(jiān)實(shí)的數(shù)據(jù)支撐。他憑借手工,就能處理完第谷20 多年收集而來的數(shù)據(jù)。這一案例反映的是他處在一個(gè)“小數(shù)據(jù)時(shí)代”。
隨后,與開普勒同時(shí)代的牛頓,通過論證開普勒行星運(yùn)動(dòng)定律與他的引力理論間的一致性,證明了地面物體與天體的運(yùn)動(dòng)都遵循著相同的自然定律,從而發(fā)現(xiàn)了萬有引力和三大運(yùn)動(dòng)定律,現(xiàn)在看來,這也是基于小數(shù)據(jù)的。這些經(jīng)典理論的提出,奠定了此后三個(gè)世紀(jì)里物理學(xué)領(lǐng)域的科學(xué)觀點(diǎn),并成為了現(xiàn)代工程學(xué)的基礎(chǔ)。再后來,隨著科學(xué)的發(fā)展,數(shù)據(jù)量有了較大的增加,為了處理那些在當(dāng)時(shí)看來的“大數(shù)據(jù)”,統(tǒng)計(jì)學(xué)家發(fā)明了抽樣方法,其基本要求是,在確保所抽取樣品具備“隨機(jī)性”的基礎(chǔ)上,來保障樣本可以對(duì)全體具有充分的代表性,從而推斷全體樣品的特性,由此解決了“大”數(shù)據(jù)處理的難題。
而當(dāng)前的大數(shù)據(jù),不僅是所謂數(shù)據(jù)海量,而且各種數(shù)據(jù)的差別非常大,用抽樣方法難以保障它的有效性。傳統(tǒng)的統(tǒng)計(jì)方法,之所以不能適用于現(xiàn)在的大數(shù)據(jù),大致源于如下三點(diǎn)原因。
(1)在第四章中,我們討論了大數(shù)據(jù)的“4V”特征,其中最能反映大數(shù)據(jù)和小數(shù)據(jù)不同之處,就是它的“多樣性”(Variety):由多種數(shù)據(jù)來源組成的一個(gè)的數(shù)據(jù)。在多種數(shù)據(jù)源的應(yīng)用環(huán)境中,抽樣很難保障它的“無偏性”(unbiasedness)。
(2)統(tǒng)計(jì)學(xué)家們?cè)O(shè)計(jì)的統(tǒng)計(jì)模型,其結(jié)論的性,強(qiáng)烈依賴于與結(jié)論有關(guān)的應(yīng)用類型。目前大數(shù)據(jù)的主力軍——網(wǎng)絡(luò)數(shù)據(jù)呈現(xiàn)長(zhǎng)尾分布(長(zhǎng)尾理論將在后面的小節(jié)介紹),使得傳統(tǒng)的標(biāo)準(zhǔn)方差等衡量標(biāo)準(zhǔn)失效,“長(zhǎng)相依”和“不平穩(wěn)”常常超過了經(jīng)典時(shí)間序列的基本假設(shè)。
(3)傳統(tǒng)的機(jī)器學(xué)習(xí)方法,通過先在較小的數(shù)據(jù)集樣本中學(xué)習(xí),然后調(diào)整參數(shù),驗(yàn)證分類、判定等“假設(shè)”和“模型”的適用性,再推而廣之到更大的數(shù)據(jù)集上。通常來說,一般的NlogN、N2 N2 等級(jí)別的算法復(fù)雜度,是可以容忍的,然而面對(duì)PB 級(jí)別(1PB=1 024TB=1 024×1 024GB=1 125 899 906 842 624 Bytes)的大數(shù)據(jù)處理,這種算法復(fù)雜度已經(jīng)難以忍受,因此需要設(shè)計(jì)新的數(shù)據(jù)處理算法來適應(yīng)這一新情況。江西財(cái)經(jīng)大學(xué)科技哲學(xué)教授黃欣榮,對(duì)小數(shù)據(jù)和大數(shù)據(jù)“質(zhì)”的區(qū)別也做了比較到位的描述。
(1)從采集手段上來說,小數(shù)據(jù)屬于人工數(shù)據(jù),是有意測(cè)量、采集的數(shù)據(jù);而大數(shù)據(jù)大多數(shù)是由智能系統(tǒng)自動(dòng)采集或人們無意留下的數(shù)據(jù)(比如,用戶在搜索引擎中使用的搜索關(guān)鍵字、服務(wù)器運(yùn)行的各種日志等),因?yàn)楫?dāng)時(shí)沒有什么明顯的用途,很多大數(shù)據(jù)一度被稱為“垃圾數(shù)據(jù)”。目前,“數(shù)據(jù)排放”(data emission)——互聯(lián)網(wǎng)用戶留下的點(diǎn)點(diǎn)滴滴(如點(diǎn)擊記錄、瀏覽時(shí)間、評(píng)價(jià)內(nèi)容等),都可以發(fā)掘出價(jià)值,目前正成為網(wǎng)絡(luò)經(jīng)濟(jì)主流。在大數(shù)據(jù)時(shí)代,有個(gè)口號(hào)就是,記錄一切數(shù)據(jù),等待有趣的事發(fā)生。在特定的生態(tài)環(huán)境下,用適合的工具挖掘,大數(shù)據(jù)中的所謂“垃圾數(shù)據(jù)”就不再垃圾。
(2)從存儲(chǔ)介質(zhì)和處理平臺(tái)來看,小數(shù)據(jù)因?yàn)槿萘枯^小,常存儲(chǔ)于本地存儲(chǔ)介質(zhì)中,其處理平臺(tái)僅需單機(jī)即可完成,數(shù)據(jù)的處理者清楚地知道數(shù)據(jù)“身處何地”,可以“親力親為”地編寫對(duì)應(yīng)的數(shù)據(jù)分析程序。而現(xiàn)在的大數(shù)據(jù),往往因數(shù)量過大,而不得已存放于“云端”中,“云深不知處”,云計(jì)算利用自己的“虛擬化”技術(shù),讓用戶不知道也不需要知道數(shù)據(jù)存在哪臺(tái)“云計(jì)算”的服務(wù)器上。就如同用水、用電一樣,用戶無須知道自來水廠和發(fā)電廠在哪里一樣,僅僅打開水龍頭、按下開關(guān)就能得到水資源和電資源。所謂的云計(jì)算,就其本質(zhì)而言,就是一種以互聯(lián)網(wǎng)為連接中介,以租賃服務(wù)的方式,為用戶提供動(dòng)態(tài)可伸縮的虛擬化資源的計(jì)算模式。中國(guó)寬帶資本基金董事長(zhǎng)田溯寧先生曾總結(jié)說,大數(shù)據(jù)與云計(jì)算就好比一個(gè)問題的兩面。如果說大數(shù)據(jù)是有待解決的問題,那么云計(jì)算就是問題的解決方法。通過云計(jì)算對(duì)大數(shù)據(jù)進(jìn)行分析、預(yù)測(cè),會(huì)使決策更加精準(zhǔn),釋放出更多的隱藏價(jià)值。大數(shù)據(jù),這個(gè)21 世紀(jì)人類探索的新邊疆,正在被新的計(jì)算模式——云計(jì)算所發(fā)現(xiàn)和征服。
(3)從數(shù)據(jù)性質(zhì)來說,小數(shù)據(jù)因“有意采集”來支持研究者的假設(shè)或觀點(diǎn),因此可歸屬于“主觀數(shù)據(jù)”。相比較而言,大數(shù)據(jù)則因沒有事先滲透主觀意圖,數(shù)據(jù)的生產(chǎn)者反而能“真情流露”,從而更顯客觀性,因此屬于“客觀數(shù)據(jù)”。此外,根據(jù)舍恩伯格教授的觀點(diǎn),大數(shù)據(jù)不再是隨機(jī)樣本,而是全體數(shù)據(jù)。全數(shù)據(jù)是由多維度數(shù)據(jù)構(gòu)成的。一個(gè)事物的全息可見,自然比單維度的采集要來得客觀。有些商家(特別是大型電商)就是利用顧客的多維度、多層面“用戶畫像”來更刻畫客戶特征,從而達(dá)到精準(zhǔn)營(yíng)銷。舍恩伯格教授在其著作《大數(shù)據(jù)時(shí)代》一書中,開門見山地提出了大數(shù)據(jù)的哲學(xué)意義:“大數(shù)據(jù)開啟了一次重大的時(shí)代轉(zhuǎn)型。就像借助望遠(yuǎn)鏡,讓我們能夠感知浩瀚的宇宙,借助顯微鏡,我們能夠觀測(cè)渺小的微生物一樣,大數(shù)據(jù)正作為人類認(rèn)知世界的新手段、新方法、新工具,改變我們的生活、工作以及理解世界的方式,成為新發(fā)明和新服務(wù)的源泉,而更多的改變正蓄意待發(fā)……”由此可見,大數(shù)據(jù),除了在信息科學(xué)領(lǐng)域成為研究熱點(diǎn)外,在哲學(xué)層面的認(rèn)知,也應(yīng)有所突破,這也是人類進(jìn)一步認(rèn)識(shí)世界的迫切需求。
買書必**當(dāng)!書還真不錯(cuò),一直信賴當(dāng)當(dāng)。希望當(dāng)當(dāng)一直以這種良好姿態(tài)、健康的發(fā)展、負(fù)責(zé)的態(tài)度來服務(wù)書友。十分感謝當(dāng)當(dāng)給我?guī)淼膶?shí)惠、方便和快樂!
很不錯(cuò)的,內(nèi)容詳實(shí),文筆也不錯(cuò),開卷有益!
文筆不錯(cuò),講的還不錯(cuò),質(zhì)量還行。
不錯(cuò)的書,很有深度!
文筆好啊,內(nèi)容也不錯(cuò),花了功夫?qū)懙臅?
包裝挺好的,整體也很不錯(cuò)!
內(nèi)容不錯(cuò),文筆不錯(cuò),值得一讀!GG…
本書章節(jié)設(shè)置合理,作者從大數(shù)據(jù)的歷史、內(nèi)涵、哲學(xué)與技術(shù)幾個(gè)維度進(jìn)行了系統(tǒng)的闡述。無論是文科生還是理科生的科技愛好者,都能夠有所啟發(fā)。
書的排版不錯(cuò),紙質(zhì)也不錯(cuò)。剛剛翻閱了一下,書中還有掃碼尋寶。非常期待!
還不錯(cuò)啊,挺通俗易懂的。但內(nèi)容有點(diǎn)豐富,而排版有點(diǎn)擁擠,讀起來有點(diǎn)累。
這本書對(duì)我很有啟發(fā),作者是名嚴(yán)謹(jǐn)?shù)膶W(xué)者,論述有依據(jù),但語言又很有趣,讀后既長(zhǎng)了知識(shí),又感覺很有意思,一本非常好的書,滿分推薦。
行文如流水,將本是非??菰锏膬?nèi)容娓娓道來,引人入勝。書中的小故事、小事例生動(dòng)有趣,語風(fēng)詼諧幽默。專業(yè)人士抑或非專業(yè)人士,皆可讀!
非常經(jīng)典的一本大數(shù)據(jù)科普?qǐng)D書,謝謝作者的用心和努力!已經(jīng)是第二次購買了!送給朋友學(xué)習(xí)。好評(píng),好評(píng)!
淺顯易懂,文筆生動(dòng)。是不可多得的介紹大數(shù)據(jù)入門或科普好書。
挺不錯(cuò)的!大數(shù)據(jù)的抽象各種概念娓娓道來,淺顯易懂!故事性,可讀性都很好!喜歡!
看了幾天才來評(píng)論論,難得的一本好書,作為門外漢,從作者生動(dòng)的講解中,對(duì)大數(shù)據(jù)有了基本的了解,受益匪淺。推薦給像我一樣的初學(xué)者
本書博采眾長(zhǎng),深入淺出,科普類的圖書居然被作者寫出了文學(xué)作品的色彩,一直不喜歡太學(xué)術(shù)的東西,但這本書卻增加了很多的趣味,實(shí)在難得。包裝設(shè)計(jì)也很棒,看上去挺高端大氣上檔次的,基本上每頁都有題注,作者真是參考了不少內(nèi)容,才有這么精彩的內(nèi)容呈現(xiàn)!
《品味大數(shù)據(jù)》這本書從歷史,哲學(xué)與技術(shù)等多個(gè)角度進(jìn)行了大數(shù)據(jù)的相關(guān)闡述,行文生動(dòng),詳列得當(dāng),使我受益匪淺。通過該書讓我對(duì)大數(shù)據(jù)有了更深的理解,許多恰如其分的例子,讓我明白了大數(shù)據(jù)的魅力和價(jià)值。該書不同于以往我讀到的關(guān)于大數(shù)據(jù)方面的書籍,避開晦澀的知識(shí)講解和相關(guān)闡述。這是一本值得人手一冊(cè)的好書籍,感謝作者的傾心打造,呈現(xiàn)給我們一個(gè)大數(shù)據(jù)史詩!??!
這本書將目前對(duì)于大數(shù)據(jù)不一樣的看法一一羅列,內(nèi)容深入淺出,它由數(shù)據(jù)的來源講起,深入到大數(shù)據(jù)的實(shí)際應(yīng)用。讀過之后令人受益匪淺,是一本不可多得的好書。
買回來花了幾天時(shí)間讀完,才過來評(píng)論。大數(shù)據(jù)是這幾年比較流行的技術(shù)話題,也讀了幾本相關(guān)的書籍。相比而言,這本《品位大數(shù)據(jù)》頗具獨(dú)到之處。作者以輕松寫意的筆調(diào)將相介紹了大數(shù)據(jù)這一枯燥嚴(yán)肅的技術(shù)話題,對(duì)于人文社科背景的閱讀者來說,很容易輕松愉悅地接受這一內(nèi)容。書本的前半部分介紹了大數(shù)據(jù)基本的概念和應(yīng)用,其間穿插著有關(guān)的歷史哲學(xué)小故事,使得科技文獻(xiàn)也顯示出搖曳生姿的趣味,吸引讀者一步步讀下去。后半部分則著重介紹大數(shù)據(jù)相關(guān)的技術(shù)和科研現(xiàn)狀,文風(fēng)也偏向簡(jiǎn)潔,在并不算長(zhǎng)的內(nèi)容里對(duì)大數(shù)據(jù)相關(guān)的技術(shù)進(jìn)行了全面而有重點(diǎn)的展示,非常有助于初學(xué)…
這是一本關(guān)于大數(shù)據(jù)的很好的書,作者力求將高深的理論敘述的淺顯易懂,可以讓那些對(duì)大數(shù)據(jù)方面的了解較少,但是又對(duì)此感興趣的讀者,通過閱讀此書,能夠比較容易和快速的學(xué)習(xí)到相關(guān)知識(shí)。
這本有關(guān)大數(shù)據(jù)的圖書寫得深入淺出、妙趣橫生,在輕松的閱讀中卻能深深領(lǐng)悟到很多大數(shù)據(jù)的內(nèi)涵知識(shí)。作者文筆不錯(cuò),又閱讀大量文獻(xiàn),使得該書不僅易讀,而且內(nèi)容詳實(shí)可信,是一本難得的大數(shù)據(jù)入門書籍。
整體讀下來,不像是技術(shù)類的書籍 ,語風(fēng)很幽默,通俗易懂。非專業(yè)人的我對(duì)大數(shù)據(jù)時(shí)代有了自己的領(lǐng)悟,從事營(yíng)銷的家人 也是一口氣讀完,各有所得。真心評(píng)價(jià)不錯(cuò)
通過該書對(duì)大數(shù)據(jù)有了更深的理解,許多恰如其分的例子,體現(xiàn)了大數(shù)據(jù)的魅力和價(jià)值。講解得風(fēng)趣幽默,娓娓道來,是特別適合年輕人(或初學(xué)者)來讀的一本大數(shù)據(jù)入門書,---看后受益匪淺。是不可多得的大數(shù)據(jù)書,力薦推介….
《品味大數(shù)據(jù)》這本書和《大數(shù)據(jù)時(shí)代》都是大數(shù)據(jù)科普類圖書,只不過《品味大數(shù)據(jù)》更具“本土性”,書中例子妙趣橫生,配圖頁相當(dāng)有意思,甚至還有涉及運(yùn)用的章節(jié),看后受益匪淺。如果書中能夠再多一些趣味性的實(shí)踐例子就更好了,五分。