日本免费精品视频,男人的天堂在线免费视频,成人久久久精品乱码一区二区三区,高清成人爽a毛片免费网站

在線客服
機器學習實戰圖書
人氣:106

機器學習實戰

沒有從理論角度來揭示機器學習算法背后的數學原理,而是通過“原理簡述 問題實例 實際代碼 運行效果”來介紹每一個算法。
  • 所屬分類:圖書 >計算機/網絡>程序設計>其他  
  • 作者:[美][哈林頓]
  • 產品參數:
  • 叢書名:--
  • 國際刊號:9787115317957
  • 出版社:人民郵電出版社
  • 出版時間:2013-06
  • 印刷時間:2013-06-01
  • 版次:1
  • 開本:16開
  • 頁數:--
  • 紙張:膠版紙
  • 包裝:平裝-膠訂
  • 套裝:

內容簡介

機器學習是人工智能研究領域中的一個極其重要的方向。在現今大數據時代的背景下,捕獲數據并從中萃取有價值的信息或模式,使得這一過去為分析師與數學家所專屬的研究領域越來越為人們矚目。

本書通過精心編排的實例,切入日常工作任務,摒棄學術化語言,利用高效可復用的Python代碼闡釋如何處理統計數據,進行數據分析及可視化。讀者可從中學到一些核心的機器學習算法,并將其運用于某些策略性任務中,如分類、預測及推薦等。

本書適合機器學習相關研究人員及互聯網從業人員學習參考。

編輯推薦

介紹并實現機器學習的主流算法

面向日常任務的高效實戰內容

《機器學習實戰》沒有從理論角度來揭示機器學習算法背后的數學原理,而是通過“原理簡述 問題實例 實際代碼 運行效果”來介紹每一個算法。學習計算機的人都知道,計算機是一門實踐學科,沒有真正實現運行,很難真正理解算法的精髓。這本書的好處就是邊學邊用,非常適合于急需邁進機器學習領域的人員學習。實際上,即使對于那些對機器學習有所了解的人來說,通過代碼實現也能進一步加深對機器學習算法的理解。

《機器學習實戰》的代碼采用Python語言編寫。Python代碼簡單優雅、易于上手,科學計算軟件包眾多,已經成為不少大學和研究機構進行計算機教學和科學計算的語言。相信Python編寫的機器學習代碼也能讓讀者盡快領略到這門學科的精妙之處。

作者簡介

Peter Harrington

擁有電氣工程學士和碩士學位,他曾經在美國加州和中國的英特爾公司工作7年。Peter擁有5項美國專利,在三種學術期刊上發表過文章。他現在是Zillabyte公司的首席科學家,在加入該公司之前,他曾擔任2年的機器學習軟件顧問。Peter在業余時間還參加編程競賽和建造3D打印機。

目錄

及時部分 分類

第1章 機器學習基礎

1.1 何謂機器學習

1.1.1 傳感器和海量數據

1.1.2 機器學習非常重要

1.2 關鍵術語

1.3 機器學習的主要任務

1.4 如何選擇合適的算法

1.5 開發機器學習應用程序的步驟

1.6 Python語言的優勢

1.6.1 可執行偽代碼

1.6.2 Python比較流行

1.6.3 Python語言的特色

1.6.4 Python語言的缺點及時部分 分類

第1章 機器學習基礎

1.1 何謂機器學習

1.1.1 傳感器和海量數據

1.1.2 機器學習非常重要

1.2 關鍵術語

1.3 機器學習的主要任務

1.4 如何選擇合適的算法

1.5 開發機器學習應用程序的步驟

1.6 Python語言的優勢

1.6.1 可執行偽代碼

1.6.2 Python比較流行

1.6.3 Python語言的特色

1.6.4 Python語言的缺點

1.7 NumPy函數庫基礎

1.8 本章小結

第2章 k-近鄰算法

2.1 k-近鄰算法概述

2.1.1 準備:使用Python導入數據

2.1.2 從文本文件中解析數據

2.1.3 如何測試分類器

2.2 示例:使用k-近鄰算法改進約會網站的配對效果

2.2.1 準備數據:從文本文件中解析數據

2.2.2 分析數據:使用Matplotlib創建散點圖

2.2.3 準備數據:歸一化數值

2.2.4 測試算法:作為完整程序驗證分類器

2.2.5 使用算法:構建完整可用系統

2.3 示例:手寫識別系統

2.3.1 準備數據:將圖像轉換為測試向量

2.3.2 測試算法:使用k-近鄰算法識別手寫數字

2.4 本章小結

第3章 決策樹

3.1 決策樹的構造

3.1.1 信息增益

3.1.2 劃分數據集

3.1.3 遞歸構建決策樹

3.2 在Python中使用Matplotlib注解繪制樹形圖

3.2.1 Matplotlib注解

3.2.2 構造注解樹

3.3 測試和存儲分類器

3.3.1 測試算法:使用決策樹執行分類

3.3.2 使用算法:決策樹的存儲

3.4 示例:使用決策樹預測隱形眼鏡類型

3.5 本章小結

第4章 基于概率論的分類方法:樸素貝葉斯

4.1 基于貝葉斯決策理論的分類方法

4.2 條件概率

4.3 使用條件概率來分類

4.4 使用樸素貝葉斯進行文檔分類

4.5 使用Python進行文本分類

4.5.1 準備數據:從文本中構建詞向量

4.5.2 訓練算法:從詞向量計算概率

4.5.3 測試算法:根據現實情況修改分類器

4.5.4 準備數據:文檔詞袋模型

4.6 示例:使用樸素貝葉斯過濾垃圾郵件

4.6.1 準備數據:切分文本

4.6.2 測試算法:使用樸素貝葉斯進行交叉驗證

4.7 示例:使用樸素貝葉斯分類器從個人廣告中獲取區域傾向

4.7.1 收集數據:導入RSS源

4.7.2 分析數據:顯示地域相關的用詞

4.8 本章小結

第5章 Logistic回歸

5.1 基于Logistic回歸和Sigmoid函數的分類

5.2 基于化方法的回歸系數確定

5.2.1 梯度上升法

5.2.2 訓練算法:使用梯度上升找到參數

5.2.3 分析數據:畫出決策邊界

5.2.4 訓練算法:隨機梯度上升

5.3 示例:從疝氣病癥預測病馬的死亡率

5.3.1 準備數據:處理數據中的缺失值

5.3.2 測試算法:用Logistic回歸進行分類

5.4 本章小結

第6章 支持向量機

6.1 基于較大間隔分隔數據

6.2 尋找較大間隔

6.2.1 分類器求解的優化問題

6.2.2 SVM應用的一般框架

6.3 SMO高效優化算法

6.3.1 Platt的SMO算法

6.3.2 應用簡化版SMO算法處理小規模數據集

6.4 利用完整Platt SMO算法加速優化

6.5 在復雜數據上應用核函數

6.5.1 利用核函數將數據映射到高維空間

6.5.2 徑向基核函數

6.5.3 在測試中使用核函數

6.6 示例:手寫識別問題回顧

6.7 本章小結

第7章 利用AdaBoost元算法提高分類

性能

7.1 基于數據集多重抽樣的分類器

7.1.1 bagging:基于數據隨機重抽樣的分類器構建方法

7.1.2 boosting

7.2 訓練算法:基于錯誤提升分類器的性能

7.3 基于單層決策樹構建弱分類器

7.4 完整AdaBoost算法的實現

7.5 測試算法:基于AdaBoost的分類

7.6 示例:在一個難數據集上應用AdaBoost

7.7 非均衡分類問題

7.7.1 其他分類性能度量指標:正確率、召回率及ROC曲線

7.7.2 基于代價函數的分類器決策控制

7.7.3 處理非均衡問題的數據抽樣方法

7.8 本章小結

第二部分 利用回歸預測數值型數據

第8章 預測數值型數據:回歸

8.1 用線性回歸找到擬合直線

8.2 局部加權線性回歸

8.3 示例:預測鮑魚的年齡

8.4 縮減系數來“理解”數據

8.4.1 嶺回歸

8.4.2 lasso

8.4.3 前向逐步回歸

8.5 權衡偏差與方差

8.6 示例:預測樂高玩具套裝的價格

8.6.1 收集數據:使用Google購物的API

8.6.2 訓練算法:建立模型

8.7 本章小結

第9章 樹回歸

9.1 復雜數據的局部性建模

9.2 連續和離散型特征的樹的構建

9.3 將CART算法用于回歸

9.3.1 構建樹

9.3.2 運行代碼

9.4 樹剪枝

9.4.1 預剪枝

9.4.2 后剪枝

9.5 模型樹

9.6 示例:樹回歸與標準回歸的比較

9.7 使用Python的Tkinter庫創建GUI

9.7.1 用Tkinter創建GUI

9.7.2 集成Matplotlib和Tkinter

9.8 本章小結

第三部分 無監督學習

第10章 利用K-均值聚類算法對未標注數據分組

10.1 K-均值聚類算法

10.2 使用后處理來提高聚類性能

10.3 二分K-均值算法

10.4 示例:對地圖上的點進行聚類

10.4.1 Yahoo! PlaceFinder API

10.4.2 對地理坐標進行聚類

10.5 本章小結

第11章 使用Apriori算法進行關聯分析

11.1 關聯分析

11.2 Apriori原理

11.3 使用Apriori算法來發現頻繁集

11.3.1 生成候選項集

11.3.2 組織完整的Apriori算法

11.4 從頻繁項集中挖掘關聯規則

11.5 示例:發現國會投票中的模式

11.5.1 收集數據:構建美國國會投票記錄的事務數據集

11.5.2 測試算法:基于美國國會投票記錄挖掘關聯規則

11.6 示例:發現毒蘑菇的相似特征

11.7 本章小結

第12章 使用FP-growth算法來高效發現頻繁項集

12.1 FP樹:用于編碼數據集的有效方式

12.2 構建FP樹

12.2.1 創建FP樹的數據結構

12.2.2 構建FP樹

12.3 從一棵FP樹中挖掘頻繁項集

12.3.1 抽取條件模式基

12.3.2 創建條件FP樹

12.4 示例:在Twitter源中發現一些共現詞

12.5 示例:從新聞網站點擊流中挖掘

12.6 本章小結

第四部分 其他工具

第13章 利用PCA來簡化數據

13.1 降維技術

13.2 PCA

13.2.1 移動坐標軸

13.2.2 在NumPy中實現PCA

13.3 示例:利用PCA對半導體制造數據降維

13.4 本章小結

第14章 利用SVD簡化數據

14.1 SVD的應用

14.1.1 隱性語義索引

14.1.2 推薦系統

14.2 矩陣分解

14.3 利用Python實現SVD

14.4 基于協同過濾的推薦引擎

14.4.1 相似度計算

14.4.2 基于物品的相似度還是基于用戶的相似度?

14.4.3 推薦引擎的評價

14.5 示例:餐館菜肴推薦引擎

14.5.1 推薦未嘗過的菜肴

14.5.2 利用SVD提高推薦的效果

14.5.3 構建推薦引擎面臨的挑戰

14.6 基于SVD的圖像壓縮

14.7 本章小結

第15章 大數據與MapReduce

15.1 MapReduce:分布式計算的框架

15.2 Hadoop流

15.2.1 分布式計算均值和方差的mapper

15.2.2 分布式計算均值和方差的reducer

15.3 在Amazon網絡服務上運行Hadoop程序

15.3.1 AWS上的可用服務

15.3.2 開啟Amazon網絡服務之旅

15.3.3 在EMR上運行Hadoop作業

15.4 MapReduce上的機器學習

15.5 在Python中使用mrjob來自動化MapReduce

15.5.1 mrjob與EMR的無縫集成

15.5.2 mrjob的一個MapReduce腳本剖析

15.6 示例:分布式SVM的Pegasos算法

15.6.1 Pegasos算法

15.6.2 訓練算法:用mrjob實現MapReduce版本的SVM

15.7 你真的需要MapReduce嗎?

15.8 本章小結

附錄A Python入門

附錄B 線性代數

附錄C 概率論復習

附錄D 資源

索引

版權聲明

在線預覽

大學畢業后,我先后在加利福尼亞和中國大陸的Intel公司工作。最初,我打算工作兩年之后回學校讀研究生,但是幸福時光飛逝而過,轉眼就過去了六年。那時,我意識到我必須回到校園。我不想上夜校或進行在線學習,我就想坐在大學校園里吸納學校傳授的所有知識。在大學里,好的方面不是你研修的課程或從事的研究,而是一些外圍活動:與人會面、參加研討會、加入組織、旁聽課程,以及學習未知的知識。

在2008年,我幫助籌備一個招聘會。我同一個大型金融機構的人交談,他們希望我去應聘他們機構的一個對信用卡建模(判斷某人是否會償還貸款)的崗位。他們問我對隨機分析了解多少,那時,我并不能確定“隨機”一詞的意思。他們提出的工作地點令我無法接受,所以我決定不再考慮了。但是,他們說的“隨機”讓我很感興趣,于是我拿來課程目錄,尋找含有“隨機”字樣的課程,我看到了“離散隨機系統”。我沒有注冊就直接旁聽了這門課,完成課后作業,參加考試,最終被授課教授發現。但是她很仁慈,讓我繼續學習,這讓我非常感激。上這門課,是我及時次看到將概率應用到算法中。在這之前,我見過一些算法將平均值作為外部輸入,但這次不同,方差和均值都是這些算法中的內部值。這門課主要討論時間序列數據,其中每一段數據都是一個均勻間隔樣本。我還找到了名稱中包含“機器學習”的另一門課程。該課程中的數據并不假設滿足時間的均勻間隔分布,它包含更多的算法,但嚴謹性有所降低。再后來我意識到,在經濟系、電子工程系和計算機科學系的課程中都會講授類似的算法。

2009年初,我順利畢業,并在硅谷謀得了一份軟件咨詢的工作。接下來的兩年,我先后在涉及不同技術的八家公司工作,發現了最終構成這本書主題的兩種趨勢:及時,為了開發出競爭力強的應用,不能僅僅連接數據源,而需要做更多事情;第二,用人單位希望員工既懂理論也能編程。

程序員的大部分工作可以類比于連接管道,所不同的是,程序員連接的是數據流,這也為人們帶了巨大的財富。舉一個例子,我們要開發一個在線出售商品的應用,其中主要部分是允許用戶來商品并瀏覽其他人的商品。為此,我們需要建立一個Web表單,允許用戶輸入所售商品的信息,然后將該信息傳到一個數據存儲區。要讓用戶看到其他用戶所售商品的信息,就要從數據存儲區獲取這些數據并適當地顯示出來。我可以確信,人們會通過這種方式掙錢,但是如果讓要應用更好,需要加入一些智能因素。這些智能因素包括自動刪除不適當的信息、檢測不正當交易、給出用戶可能喜歡的商品以及預測網站的流量等。為了實現這些目標,我們需要應用機器學習方法。對于最終用戶而言,他們并不了解幕后的“魔法”,他們關心的是應用能有效運行,這也是好產品的標志。

一個機構會雇用一些理論家(思考者)以及一些做實際工作的人(執行者)。前者可能會將大部分時間花在學術工作上,他們的日常工作就是基于論文產生思路,然后通過高級工具或數學進行建模。后者則通過編寫代碼與真實世界交互,處理非理想世界中的瑕疵,比如崩潰的機器或者帶噪聲的數據。區分這兩類人并不是個好想法,很多成功的機構都認識到這一點。(精益生產的一個原則就是,思考者應該自己動手去做實際工作。)當招聘經費有,誰更能得到工作,思考者還是執行者?很可能是執行者,但是現實中用人單位希望兩種人都要。很多事情都需要做,但當應用需要更高要求的算法時,那么需要的人員就必須能夠閱讀論文,領會論文思路并通過代碼實現,如此反復下去。

在這之前,我沒有看到在機器學習算法方面縮小思考者和執行者之間差距的書籍。本書的目的就是填補這個空白,同時介紹機器學習算法的使用,使得讀者能夠構建更成功的應用。

……

媒體評論

“易學易懂,用處很大。”

Alexandre Alves,Oracle CEP的架構師

“精心織構的代碼地詮釋出機器學習的核心要義。”

Patrick Toohey,Mettler-Toledo Hi-Speed軟件工程師

“實例很棒!可用于任何領域!”

John Griffin,Hibernate Search in Action一書的合作者

“敘述循序漸進,巧妙地闡述了算法之間的差異。”

Stephen McKamey,Isomer Innovations技術實踐總監

網友評論(不代表本站觀點)

來自無昵稱**的評論:

小白入門機器學習,聽說這本書很棒就買來看看

2017-11-13 22:33:21
來自匿名用**的評論:

收到后,大致翻了一下,里面有完整的Python代碼,不錯

2017-11-11 20:04:58
來自比樹還**的評論:

一直很喜歡機器學習,所以看了好久買了。希望當當經常做專業類書籍的特賣活動。

2015-10-23 21:18:45
來自zjt夢回**的評論:

上手很快,概念和代碼均有詳細介紹,而且介紹的幾種算法都是主流的,挺適合新手和實戰學習的

2017-08-03 10:13:38
來自無昵稱**的評論:

粗略翻了一下,應該是正品。有例子,適合有一定Python、線性代數和概率論基礎的童鞋。

2016-11-14 11:13:11
來自bjguxg**的評論:

用例子講解的方式,介紹了基本的機器學習算法,用python語言進行介紹,一舉兩得

2015-04-15 08:27:47
來自無昵稱**的評論:

以通俗語言去講解機器學習算法,并對其中的思想用實例去講解,是一本不可多得的好書,本人特別喜歡,贊一個!!!!!

2014-12-23 16:28:57
來自無昵稱**的評論:

這本書是兩個師兄推薦的 挺好的 就是沒有時間去試運行每一個例子

2017-09-23 15:45:19
來自entol**的評論:

這本書絕對不適合入門的人看,不過想要提升Python的朋友可以看看,這本書講解了許多算法,相信能幫你提升一個水平

2016-01-17 18:00:04
來自hui_li**的評論:

看微博大牛們推薦才來買,還沒看。馬少平THU:周末粗看了一邊@王斌_ICTIR 翻譯的《機器學習實戰》一書,如同書名一樣,只講實戰,不涉及原理。對于使用機器學習方法解決其他問題的初學者是一本很好的快速掌握機器學習方法的入門書。再配合@李航博士 的《統計學習方法》,對于不研究機器學習方法,只用于求解問題的人來說,是一個很好的組合。

2013-06-24 22:41:02
來自梅***(**的評論:

買來學習的,很具有可操作性。可與網絡材料對比使用。

2017-09-28 21:20:24
來自stevenz**的評論:

講python用于機器學習的書,實踐性強,理論偏弱

2016-04-23 23:31:48
來自張建110**的評論:

機器學習挺熱的,看見這本排名靠前就買了,還沒仔細看

2016-06-06 17:01:18
來自思之于**的評論:

機器學習是未來的趨勢,現在學習是未來不被浪潮推翻

2016-04-24 19:13:13
來自feilong**的評論:

機器學習實戰【利用Python透析主流機器學習算法,配合日常用例,強勁實戰導向,程序員人手必備!】

2014-04-06 09:05:35
來自xiangxt**的評論:

介紹算法的部分沒有看到偽代碼之類的。直接程序里去介紹。書的總體布局不錯。最關鍵的是,人民郵電翻譯的非常好。這本書的英文版我自己打印過。所以,買中文版的時候最關心的就是翻譯。這方面算是過關吧。

2013-07-19 08:14:13
來自無昵稱**的評論:

心愛的機器學習書,包裝完好,雖然已經看了電子版,還是入手一本

2016-12-09 21:20:44
來自l***6(**的評論:

這本書程序和算法并存,python與偽代碼共舞,寫的非常好,如果算法再多些會更好。書特別適合入門

2017-06-17 17:02:15
來自無昵稱**的評論:

很不錯的一本實戰書籍,后面還附帶了閱讀所需得知識點提要。配合機器學習的課程視頻一起看效果更佳

2017-02-09 15:07:57
來自匿名用**的評論:

書收到了,非常好,很經典的書。應該說是機器學習入門的必看書籍吧。

2017-06-01 23:12:44
來自無昵稱**的評論:

每段代碼講的都很詳細,很棒的一本書,適合想學用Python進行數據分析的初學者

2017-09-26 14:06:15
來自neujimm**的評論:

這本書我感覺是機器學習領域里寫的特別平實的一本,沒有太多理論說教,就是給出例子告訴你怎么去做,很適合初學者學習。

2016-04-23 22:26:43
來自匿名用**的評論:

送快遞的腦子有病吧?送到公司前臺一通罵,說地址沒寫樓層害的自己找了半天,鬧得一層樓的人都知道,結果他媽的是自己沒看清,本來就是寫好了的,神經病,再也不在當當買書了!!!

2017-02-14 15:12:52
來自無昵稱**的評論:

我一直以為評價只是一句話,對大家沒什么幫助,自從知道了評價有得積分,積分再換那幾分錢,我覺定還是說點么用的,換點錢。于是,我就發了這評論,所以,就這評論有什么卵用?答案是;沒有。

2016-11-01 17:50:31
來自起***o(**的評論:

內容很好,就是沒有線性分類器的實現,基本上主要的機器學習算法都有了

2017-03-19 08:44:03
來自***(匿**的評論:

python代碼配合偽代碼,完美,一邊學習機器學習一邊學習python,作為第二語言,很不錯。

2017-03-13 19:24:22
來自hezexia**的評論:

這本書涉及機器學習的代碼實現,適合我這樣的初學菜鳥。。。

2017-08-22 10:15:39
來自匿名用**的評論:

一直想買的書,對phython理解有幫助,對機器學習的講解也和細

2017-07-19 21:26:51
來自無昵稱**的評論:

機器學習中算是良心之作了,比很多都要好的多。

2017-08-25 11:13:39
來自無昵稱**的評論:

介紹機器學習的入門書,使用Python實現。示范的例子都挺有趣的,比如國會選舉、twitter數據的分析。算法的覆蓋面挺廣,可惜原理的講解有些淺,因此需要一些基礎知識。書中沒有神經網絡算法的介紹,有些遺憾。

2016-04-27 21:05:24

免責聲明

更多出版社