在如今這個(gè)處處以數(shù)據(jù)驅(qū)動(dòng)的世界中,機(jī)器學(xué)習(xí)正變得越來(lái)越大眾化。它已經(jīng)被廣泛地應(yīng)用于不同領(lǐng)域,如搜索引擎、機(jī)器人、無(wú)人駕駛汽車等。本書首先通過(guò)實(shí)用的案例介紹機(jī)器學(xué)習(xí)的基礎(chǔ)知識(shí),然后介紹一些稍微復(fù)雜的機(jī)器學(xué)習(xí)算法,例如支持向量機(jī)、極-端森林、隱馬爾可夫模型、條件場(chǎng)、深度神經(jīng)網(wǎng)絡(luò),等等。
用zui火的Python語(yǔ)言、通過(guò)各種各樣的機(jī)器學(xué)習(xí)算法來(lái)解決實(shí)際問(wèn)題! 書中介紹的主要問(wèn)題如下。 - 探索分類分析算法并將其應(yīng)用于收入等級(jí)評(píng)估問(wèn)題 - 使用預(yù)測(cè)建模并將其應(yīng)用到實(shí)際問(wèn)題中 - 了解如何使用無(wú)監(jiān)督學(xué)習(xí)來(lái)執(zhí)行市場(chǎng)細(xì)分 - 探索數(shù)據(jù)可視化技術(shù)以多種方式與數(shù)據(jù)進(jìn)行交互 - 了解如何構(gòu)建推薦引擎 - 理解如何與文本數(shù)據(jù)交互并構(gòu)建模型來(lái)分析它 - 使用隱馬爾科夫模型來(lái)研究語(yǔ)音數(shù)據(jù)并識(shí)別語(yǔ)音
Prateek Joshi 人工智能專家,重點(diǎn)關(guān)注基于內(nèi)容的分析和深度學(xué)習(xí),曾在英偉達(dá)、微軟研究院、高通公司以及硅谷的幾家早期創(chuàng)業(yè)公司任職。個(gè)人博客地址: www.prateekj.com
第1 章 監(jiān)督學(xué)習(xí) ............................................. 1
1.1 簡(jiǎn)介 ................................................. 1
1.2 數(shù)據(jù)預(yù)處理技術(shù) ....................................... 2
1.2.1 準(zhǔn)備工作 ....................................... 2
1.2.2 詳細(xì)步驟 ....................................... 2
1.3 標(biāo)記編碼方法 ........................................... 4
1.4 創(chuàng)建線性回歸器 ....................................... 6
1.4.1 準(zhǔn)備工作 ....................................... 6
1.4.2 詳細(xì)步驟 ....................................... 7
1.5 計(jì)算回歸性 ....................................... 9
1.5.1 準(zhǔn)備工作 ....................................... 9
1.5.2 詳細(xì)步驟 ...................................... 10
1.6 保存模型數(shù)據(jù) .......................................... 10
1.7 創(chuàng)建嶺回歸器 .......................................... 11
1.7.1 準(zhǔn)備工作 ...................................... 11
1.7.2 詳細(xì)步驟 ...................................... 12
1.8 創(chuàng)建多項(xiàng)式回歸器 .................................. 13
1.8.1 準(zhǔn)備工作 ...................................... 13
1.8.2 詳細(xì)步驟 ...................................... 14
1.9 估算房屋價(jià)格 .......................................... 15
1.9.1 準(zhǔn)備工作 ...................................... 15
1.9.2 詳細(xì)步驟 ...................................... 16
1.10 計(jì)算特征的相對(duì)重要性 ......................... 17
1.11 評(píng)估共享單車的需求分布 ..................... 19
1.11.1 準(zhǔn)備工作 .................................. 19
1.11.2 詳細(xì)步驟 .................................. 19
1.11.3 更多內(nèi)容 .................................. 21
第2 章 創(chuàng)建分類器 ........................................ 24
2.1 簡(jiǎn)介 ........................................... 24
2.2 建立簡(jiǎn)單分類器 ...................................... 25
2.2.1 詳細(xì)步驟 ...................................... 25
2.2.2 更多內(nèi)容 ...................................... 27
2.3 建立邏輯回歸分類器 .............................. 27
2.4 建立樸素貝葉斯分類器 ........................... 31
2.5 將數(shù)據(jù)集分割成訓(xùn)練集和測(cè)試集 ........... 32
2.6 用交叉驗(yàn)證檢驗(yàn)?zāi)P托?................... 33
2.6.1 準(zhǔn)備工作 ...................................... 34
2.6.2 詳細(xì)步驟 ...................................... 34
2.7 混淆矩陣可視化 ...................................... 35
2.8 提取性能報(bào)告 .......................................... 37
2.9 根據(jù)汽車特征評(píng)估質(zhì)量 ........................... 38
2.9.1 準(zhǔn)備工作 ...................................... 38
2.9.2 詳細(xì)步驟 ...................................... 38
2.10 生成驗(yàn)證曲線 ........................................ 40
2.11 生成學(xué)習(xí)曲線 ........................................ 43
2.12 估算收入階層 ........................................ 45
第3 章 預(yù)測(cè)建模 ............................................ 48
3.1 簡(jiǎn)介 ............................................ 48
3.2 用SVM 建立線性分類器 ........................ 49
3.2.1 準(zhǔn)備工作 ...................................... 49
3.2.2 詳細(xì)步驟 ...................................... 50
3.3 用SVM 建立非線性分類器 .................... 53
3.4 解決類型數(shù)量不平衡問(wèn)題 ....................... 55
3.5 提取置信度 .............................................. 58
3.6 尋找超參數(shù) ...................................... 60
3.7 建立事件預(yù)測(cè)器 ...................................... 62
3.7.1 準(zhǔn)備工作 ...................................... 62
3.7.2 詳細(xì)步驟 ...................................... 62
3.8 估算交通流量 .......................................... 64
3.8.1 準(zhǔn)備工作 ...................................... 64
3.8.2 詳細(xì)步驟 ...................................... 64
第4 章 無(wú)監(jiān)督學(xué)習(xí)——聚類....................... 67
4.1 簡(jiǎn)介 ....................................... 67
4.2 用k-means 算法聚類數(shù)據(jù) ....................... 67
4.3 用矢量量化壓縮圖片 .............................. 70
4.4 建立均值漂移聚類模型 ........................... 74
4.5 用凝聚層次聚類進(jìn)行數(shù)據(jù)分組 ............... 76
4.6 評(píng)價(jià)聚類算法的聚類效果 ....................... 79
4.7 用DBSCAN 算法自動(dòng)估算集群數(shù)量 ..... 82
4.8 探索股票數(shù)據(jù)的模式 .............................. 86
4.9 建立客戶細(xì)分模型 .................................. 88
第5 章 構(gòu)建推薦引擎 ................................... 91
5.1 簡(jiǎn)介 ...................................... 91
5.2 為數(shù)據(jù)處理構(gòu)建函數(shù)組合 ....................... 92
5.3 構(gòu)建機(jī)器學(xué)習(xí)流水線 .............................. 93
5.3.1 詳細(xì)步驟 ...................................... 93
5.3.2 工作原理 ...................................... 95
5.4 尋找最近鄰 .............................................. 95
5.5 構(gòu)建一個(gè)KNN 分類器 ............................ 98
5.5.1 詳細(xì)步驟 ...................................... 98
5.5.2 工作原理 .................................... 102
5.6 構(gòu)建一個(gè)KNN 回歸器 .......................... 102
5.6.1 詳細(xì)步驟 .................................... 102
5.6.2 工作原理 .................................... 104
5.7 計(jì)算歐氏距離分?jǐn)?shù) ................................ 105
5.8 計(jì)算皮爾遜相關(guān)系數(shù) ............................ 106
5.9 尋找數(shù)據(jù)集中的相似用戶 ..................... 108
5.10 生成電影推薦 ...................................... 109
第6 章 分析文本數(shù)據(jù) ................................. 112
6.1 簡(jiǎn)介 ....................................... 112
6.2 用標(biāo)記解析的方法預(yù)處理數(shù)據(jù) ............. 113
6.3 提取文本數(shù)據(jù)的詞干 ............................ 114
6.3.1 詳細(xì)步驟 .................................... 114
6.3.2 工作原理 .................................... 115
6.4 用詞形還原的方法還原文本的基本形式 .................... 116
6.5 用分塊的方法劃分文本 ........................ 117
6.6 創(chuàng)建詞袋模型 ........................................ 118
6.6.1 詳細(xì)步驟 .................................... 118
6.6.2 工作原理 .................................... 120
6.7 創(chuàng)建文本分類器 .................................... 121
6.7.1 詳細(xì)步驟 .................................... 121
6.7.2 工作原理 .................................... 123
6.8 識(shí)別性別 ............................................. 124
6.9 分析句子的情感 .................................... 125
6.9.1 詳細(xì)步驟 .................................... 126
6.9.2 工作原理 .................................... 128
6.10 用主題建模識(shí)別文本的模式 ............... 128
6.10.1 詳細(xì)步驟 .................................. 128
6.10.2 工作原理 .................................. 131
第7 章 語(yǔ)音識(shí)別 ......................................... 132
7.1 簡(jiǎn)介 .......................................... 132
7.2 讀取和繪制音頻數(shù)據(jù) ............................ 132
7.3 將音頻信號(hào)轉(zhuǎn)換為頻域 ........................ 134
7.4 自定義參數(shù)生成音頻信號(hào) ..................... 136
7.5 合成音樂(lè) .......................................... 138
7.6 提取頻域特征 ........................................ 140
7.7 創(chuàng)建隱馬爾科夫模型 ............................ 142
7.8 創(chuàng)建一個(gè)語(yǔ)音識(shí)別器 ............................ 143
第8 章 解剖時(shí)間序列和時(shí)序數(shù)據(jù) ............ 147
8.1 簡(jiǎn)介 ............................................. 147
8.2 將數(shù)據(jù)轉(zhuǎn)換為時(shí)間序列格式 ................. 148
8.3 切分時(shí)間序列數(shù)據(jù) ................................ 150
8.4 操作時(shí)間序列數(shù)據(jù) ................................ 152
8.5 從時(shí)間序列數(shù)據(jù)中提取統(tǒng)計(jì)數(shù)字 ......... 154
8.6 針對(duì)序列數(shù)據(jù)創(chuàng)建隱馬爾科夫模型 ..... 157
8.6.1 準(zhǔn)備工作 .................................... 158
8.6.2 詳細(xì)步驟 .................................... 158
8.7 針對(duì)序列文本數(shù)據(jù)創(chuàng)建條件隨機(jī)場(chǎng) ..... 161
8.7.1 準(zhǔn)備工作 .................................... 161
8.7.2 詳細(xì)步驟 .................................... 161
8.8 用隱馬爾科夫模型分析股票市場(chǎng)數(shù)據(jù).......................... 164
第9 章 圖像內(nèi)容分析 ................................. 166
9.1 簡(jiǎn)介 .............................................. 166
9.2 用OpenCV-Pyhon 操作圖像 ................. 167
9.3 檢測(cè)邊 ........................................ 170
9.4 直方圖均衡化 ........................................ 174
9.5 檢測(cè)棱角 .................................. 176
9.6 檢測(cè)SIFT 特征點(diǎn) .................................. 178
9.7 創(chuàng)建Star 特征檢測(cè)器 ............................ 180
9.8 利用視覺(jué)碼本和向量量化創(chuàng)建特征 ...... 182
9.9 用極端隨機(jī)森林訓(xùn)練圖像分類器 .......... 185
9.10 創(chuàng)建一個(gè)對(duì)象識(shí)別器 ........................... 187
第10 章 人臉識(shí)別 ........................................ 189
10.1 簡(jiǎn)介 ........................................... 189
10.2 從網(wǎng)絡(luò)攝像頭采集和處理視頻信息 .... 189
10.3 用Haar 級(jí)聯(lián)創(chuàng)建一個(gè)人臉識(shí)別器 ...... 191
10.4 創(chuàng)建一個(gè)眼睛和鼻子檢測(cè)器 ............... 193
10.5 做主成分分析 ...................................... 196
10.6 做核主成分分析 .................................. 197
10.7 做盲源分離 .......................................... 201
10.8 用局部二值模式直方圖創(chuàng)建一個(gè)人臉識(shí)別器 ................ 205
第11 章 深度神經(jīng)網(wǎng)絡(luò) ............................... 210
11.1 簡(jiǎn)介 ........................................ 210
11.2 創(chuàng)建一個(gè)感知器 .................................. 211
11.3 創(chuàng)建一個(gè)單層神經(jīng)網(wǎng)絡(luò) ....................... 213
11.4 創(chuàng)建一個(gè)深度神經(jīng)網(wǎng)絡(luò) ....................... 216
11.5 創(chuàng)建一個(gè)向量量化器........................... 219
11.6 為序列數(shù)據(jù)分析創(chuàng)建一個(gè)遞歸神經(jīng)網(wǎng)絡(luò) ...................... 221
11.7 在光學(xué)字符識(shí)別數(shù)據(jù)庫(kù)中將字符可視化 ...................... 225
11.8 用神經(jīng)網(wǎng)絡(luò)創(chuàng)建一個(gè)光學(xué)字符識(shí)別器 ....................... 226
第12 章 可視化數(shù)據(jù) ................................... 230
12.1 簡(jiǎn)介 ............................................... 230
12.2 畫3D 散點(diǎn)圖 ....................................... 230
12.3 畫氣泡圖 ............................................ 232
12.4 畫動(dòng)態(tài)氣泡圖 ...................................... 233
12.5 畫餅圖 ............................................... 235
12.6 畫日期格式的時(shí)間序列數(shù)據(jù) ............... 237
12.7 畫直方圖 ............................................ 239
12.8 可視化熱力圖 ...................................... 241
12.9 動(dòng)態(tài)信號(hào)的可視化模擬 ....................... 242
ok ok
圖書質(zhì)量很好,一直在當(dāng)當(dāng)自營(yíng)上購(gòu)買圖書,值得信賴。