數(shù)據(jù)科學(xué)是一門新興的熱門科學(xué),國(guó)外大學(xué)紛紛設(shè)立同名課程,相應(yīng)的專業(yè)、課程及書籍也深受歡迎。本書是國(guó)內(nèi)及時(shí)部系統(tǒng)闡述數(shù)據(jù)科學(xué)的重要專著,填補(bǔ)了國(guó)內(nèi)此領(lǐng)域的空白。本書在結(jié)構(gòu)設(shè)計(jì)和內(nèi)容選擇上不僅充分借鑒了國(guó)外著名大學(xué)設(shè)立的相關(guān)課程以及全球暢銷的外文專著,也考慮到了國(guó)內(nèi)相關(guān)課程定位與專業(yè)人才的培養(yǎng)需求。 本書共包括8個(gè)部分(基礎(chǔ)知識(shí)、數(shù)據(jù)預(yù)處理、數(shù)據(jù)統(tǒng)計(jì)、機(jī)器學(xué)習(xí)、數(shù)據(jù)可視化、數(shù)據(jù)計(jì)算、數(shù)據(jù)管理以及R編程),既涵蓋了數(shù)據(jù)科學(xué)的基本內(nèi)容,又避免了與相關(guān)課程的低級(jí)重復(fù)。每章設(shè)有綜合例題,做到理論學(xué)習(xí)與動(dòng)手操作相結(jié)合。例題均采用R語言完成數(shù)據(jù)科學(xué)的特定任務(wù)。每章的首尾配有“導(dǎo)讀”與“小結(jié)”,便于教師的教學(xué)和學(xué)生的自學(xué)。“習(xí)題”部分以主動(dòng)數(shù)據(jù)收集和分析的開放題目為主,旨在幫助學(xué)生提高自我學(xué)習(xí)能力。書后附有R語言語法,便于入門的教學(xué)與學(xué)習(xí)。 本書可以滿足數(shù)據(jù)科學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、管理學(xué)、數(shù)據(jù)統(tǒng)計(jì)、數(shù)據(jù)分析、圖情檔類等多個(gè)專業(yè)的老師、學(xué)生(含碩士生和博士生)的教學(xué)與自學(xué)需要。
(1)本書是國(guó)內(nèi)本系統(tǒng)介紹數(shù)據(jù)科學(xué)的重要的專著,填補(bǔ)了國(guó)內(nèi)此領(lǐng)域的空白。 (2)在結(jié)構(gòu)設(shè)計(jì)和內(nèi)容選擇上,不僅充分借鑒了國(guó)外著名大學(xué)設(shè)立的相關(guān)課程以及全球暢銷的英文專著,而且也考慮到了國(guó)內(nèi)相關(guān)課程定位與專業(yè)人才的培養(yǎng)需求。
目錄
第1章基礎(chǔ)理論
1.1數(shù)據(jù)
1.1.1數(shù)據(jù)模型
1.1.2數(shù)據(jù)維度
1.2大數(shù)據(jù)
1.2.1內(nèi)涵與特征
1.2.2大數(shù)據(jù)時(shí)代的新理念
1.2.3大數(shù)據(jù)時(shí)代的新術(shù)語
1.3數(shù)據(jù)科學(xué)概述
1.3.1研究目的
1.3.2理論基
1.3.3研究?jī)?nèi)容
1.3.4基本流程
1.3.5主要原則
1.3.6典型應(yīng)用
1.4數(shù)據(jù)科學(xué)家
1.4.1主要任務(wù)
1.4.2能力要求
1.4.3常用工具
1.4.4團(tuán)隊(duì)工作
1.5數(shù)據(jù)科學(xué)項(xiàng)目
1.5.1角色定義
1.5.2基本流程
1.6應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
第2章數(shù)據(jù)預(yù)處理
2.1數(shù)據(jù)質(zhì)量
2.1.1統(tǒng)計(jì)學(xué)規(guī)律
2.1.2語言學(xué)規(guī)律
2.1.3數(shù)據(jù)連續(xù)性理論
2.1.4數(shù)據(jù)鑒別技術(shù)
2.1.5探索性數(shù)據(jù)分析
2.2數(shù)據(jù)審計(jì)
2.2.1預(yù)定義審計(jì)
2.2.2自定義審計(jì)
2.2.3可視化審計(jì)
2.3數(shù)據(jù)清洗
2.3.1缺失數(shù)據(jù)處理
2.3.2冗余數(shù)據(jù)處理
2.3.3噪聲數(shù)據(jù)處理
2.4數(shù)據(jù)變換
2.4.1大小變換
2.4.2類型變換
2.5數(shù)據(jù)集成
2.5.1基本類型
2.5.2主要問題
2.6其他預(yù)處理方法
2.6.1數(shù)據(jù)脫敏
2.6.2數(shù)據(jù)歸約
2.6.3數(shù)據(jù)標(biāo)注
2.7應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
第3章數(shù)據(jù)統(tǒng)計(jì)
3.1概率分布
3.1.1正態(tài)分布
3.1.2卡方分布
3.1.3t分布
3.1.4F分布
3.2參數(shù)估計(jì)
3.2.1點(diǎn)估計(jì)
3.2.2區(qū)間估計(jì)
3.3假設(shè)檢驗(yàn)
3.3.1參數(shù)檢驗(yàn)
3.3.2非參數(shù)檢驗(yàn)
3.4基本分析方法
3.4.1相關(guān)分析
3.4.2回歸分析
3.4.3方差分析
3.4.4分類分析
3.4.5聚類分析
3.4.6時(shí)間序列分析
3.4.7其他方法
3.5元分析方法
3.5.1加權(quán)平均法
3.5.2優(yōu)化方法
3.6應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
第4章機(jī)器學(xué)習(xí)
4.1基本概念
4.1.1定義
4.1.2應(yīng)用
4.2機(jī)器學(xué)習(xí)活動(dòng)
4.2.1訓(xùn)練經(jīng)驗(yàn)的選擇
4.2.2目標(biāo)函數(shù)的選擇
4.2.3目標(biāo)函數(shù)的表示
4.2.4函數(shù)逼近算法的選擇
4.3機(jī)器學(xué)習(xí)系統(tǒng)
4.3.1執(zhí)行器
4.3.2評(píng)價(jià)器
4.3.3泛化器
4.3.4實(shí)驗(yàn)生成器
4.4主要類型
4.4.1基于實(shí)例學(xué)習(xí)
4.4.2概念學(xué)習(xí)
4.4.3決策樹學(xué)習(xí)
4.4.4人工神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)
4.4.5貝葉斯學(xué)習(xí)
4.4.6遺傳算法
4.4.7分析學(xué)習(xí)
4.4.8增強(qiáng)學(xué)習(xí)
4.5典型算法
4.5.1KMeans算法
4.5.2KNN算法
4.5.3ID3算法
4.6應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
第5章數(shù)據(jù)可視化
5.1主要類型
5.1.1科學(xué)可視化
5.1.2信息可視化
5.1.3可視分析學(xué)
5.2基本模型
5.2.1順序模型
5.2.2循環(huán)模型
5.2.3分析模型
5.3常用方法
5.3.1視覺編碼
5.3.2統(tǒng)計(jì)圖表
5.3.3圖論方法
5.3.4視覺隱喻
5.3.5圖形符號(hào)學(xué)
5.3.6面向領(lǐng)域的方法
5.4視覺編碼
5.4.1視覺感知
5.4.2數(shù)據(jù)類型
5.4.3視覺通道
5.4.4視覺假象
5.5評(píng)價(jià)與改進(jìn)
5.5.1測(cè)評(píng)原則
5.5.2測(cè)評(píng)流程
5.5.3測(cè)評(píng)方法
5.6應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
第6章數(shù)據(jù)計(jì)算
6.1計(jì)算模式的演變
6.1.1集中式計(jì)算
6.1.2分布式計(jì)算
6.1.3網(wǎng)格計(jì)算
6.1.4云計(jì)算
6.2主流計(jì)算框架——MapReduce
6.2.1基本思想
6.2.2實(shí)現(xiàn)過程
6.2.3主要特征
6.2.4關(guān)鍵技術(shù)
6.5.5下一代MapReduce
6.3主流計(jì)算平臺(tái)——Hadoop MapReduce
6.3.1數(shù)據(jù)流
6.3.2任務(wù)處理
6.3.3技術(shù)實(shí)現(xiàn)
6.3.4YARN
6.4其他相關(guān)計(jì)算系統(tǒng)——Hadoop生態(tài)系統(tǒng)
6.4.1HDFS
6.4.2Hive
6.4.3Pig
6.4.4Mahout
6.4.5HBase
6.4.6ZooKeeper
6.4.7Flume
6.4.8Sqoop
6.5應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
第7章數(shù)據(jù)管理
7.1基本類型
7.1.1關(guān)系數(shù)據(jù)庫(kù)
7.1.2NoSQL
7.1.3關(guān)系云
7.2體系結(jié)構(gòu)
7.2.1MasterSlave結(jié)構(gòu)
7.2.2P2P結(jié)構(gòu)
7.3關(guān)鍵技術(shù)
7.3.1數(shù)據(jù)模型
7.3.2數(shù)據(jù)分布
7.3.3數(shù)據(jù)一致性
7.3.4CAP理論與BASE原則
7.3.5視圖與物化視圖
7.3.6事務(wù)與版本戳
7.4典型系統(tǒng)
7.4.1Memcached
7.4.2MongoDB
7.4.3Cassandra
7.4.4HBase
7.5應(yīng)用案例
小結(jié)
習(xí)題
參考文獻(xiàn)及擴(kuò)展閱讀資料
附錄AR語言與R軟件
附錄B術(shù)語索引
入門學(xué)者也能看懂,買值了!
書很好贊,賣家發(fā)貨很快~
收到之后很滿意 推薦大家購(gòu)買
內(nèi)容詳實(shí),轉(zhuǎn)行數(shù)據(jù)科學(xué)必備的啟蒙書
包裝完好,物流很快!
因推薦而屯書,要慢慢擠時(shí)間來看,時(shí)間太少了呀,另外,當(dāng)當(dāng)包裝確實(shí)太大意,有一本書都磕碰壞了,哎
書挺不錯(cuò)的。
物流很快,當(dāng)當(dāng)服務(wù)也Nice;一本內(nèi)容前沿,通俗易懂的好書~~~
今天收到書了,制作很精美。內(nèi)容很新,結(jié)構(gòu)清晰。目測(cè)是一本能看得進(jìn)去的書,一級(jí)贊哦~~
非常棒的一本書!受益匪淺,朋友看了也讓幫忙買!
前言句句深入人心,很有范。一口氣讀下機(jī)器學(xué)習(xí)那一章,原來深?yuàn)W的理論也這樣通俗易懂,好書好書,非常經(jīng)典,大贊
購(gòu)買了很多大數(shù)據(jù)和數(shù)據(jù)科學(xué)相關(guān)的圖書,這本書才是符合我需要的,滿滿的干貨
當(dāng)當(dāng)發(fā)貨速度很快,早就對(duì)數(shù)據(jù)科學(xué)很敢興趣,此書作為國(guó)內(nèi)學(xué)者關(guān)于數(shù)據(jù)科學(xué)的第一本專著,一定要好好拜讀一下。
正在看,感覺整個(gè)體系架構(gòu)很嚴(yán)謹(jǐn),很適合對(duì)數(shù)據(jù)科學(xué)有興趣的初學(xué)者。其實(shí)對(duì)我來講數(shù)據(jù)科學(xué)的內(nèi)容還是有點(diǎn)枯燥的,但是這本書就很能讓人讀得下去。好評(píng)!
大數(shù)據(jù)熱的時(shí)代,處處充斥對(duì)數(shù)據(jù)、對(duì)數(shù)據(jù)應(yīng)用的討論,但是對(duì)一些基本的數(shù)據(jù)知識(shí)比較迷茫,所以看到書名眼前一亮。大致翻閱,這本書系統(tǒng)性很強(qiáng),引用材料較新,理論知識(shí)普及和實(shí)踐引用性都很強(qiáng),為相關(guān)研究者、對(duì)數(shù)據(jù)科學(xué)感興趣的讀者提供了很有用知識(shí),值得購(gòu)買,贊一個(gè)。
大道至簡(jiǎn),通俗易懂,簡(jiǎn)約而不簡(jiǎn)單。這本書選材新穎,包含了數(shù)據(jù)科學(xué)的最新成果與實(shí)踐,內(nèi)容詳實(shí),介紹了數(shù)據(jù)科學(xué)的理論基礎(chǔ)與實(shí)驗(yàn)操作,體系嚴(yán)謹(jǐn),搭建了數(shù)據(jù)科學(xué)的整體框架,對(duì)于數(shù)據(jù)科學(xué)的學(xué)習(xí)參考、激發(fā)靈感、開闊視野大有裨益,???...