《貝葉斯方法 概率編程與貝葉斯推斷》基于PyMC語言以及一系列常用的Python數(shù)據(jù)分析框架,如NumPy、SciPy和Matplotlib,通過概率編程的方式,講解了貝葉斯推斷的原理和實(shí)現(xiàn)方法。該方法常常可以在避免引入大量數(shù)學(xué)分析的前提下,有效地解決問題。書中使用的案例往往是工作中遇到的實(shí)際問題,有趣并且實(shí)用。作者的闡述也盡量避免冗長的數(shù)學(xué)分析,而讓讀者可以動手解決一個個的具體問題。通過對本書的學(xué)習(xí),讀者可以對貝葉斯思維、概率編程有較為深入的了解,為將來從事機(jī)器學(xué)習(xí)、數(shù)據(jù)分析相關(guān)的工作打下基礎(chǔ)。本書適用于機(jī)器學(xué)習(xí)、貝葉斯推斷、概率編程等相關(guān)領(lǐng)域的從業(yè)者和愛好者,也適合普通開發(fā)人員了解貝葉斯統(tǒng)計(jì)而使用。
國際杰出機(jī)器學(xué)習(xí)專家、地平線機(jī)器人技術(shù)創(chuàng)始人和CEO、前百度研究院執(zhí)行院長余凱博士,騰訊專家研究員岳亞丁博士推薦、審校 內(nèi)容涉及Python語言庫PyMC,以及相關(guān)的工具,包括NumPy\SciPy\Matplotlib,無需復(fù)雜的數(shù)學(xué)分析,通過實(shí)例、從編程的角度介紹貝葉斯分析方法,大多數(shù)程序員都可以入門并掌握。 本書的內(nèi)容特色: 學(xué)習(xí)貝葉斯思維方式 理解計(jì)算機(jī)如何進(jìn)行貝葉斯推斷 利用PyMC Python庫進(jìn)行編程來實(shí)現(xiàn)貝葉斯分析 利用PyMC建模以及調(diào)試 測試模型的擬合優(yōu)度 打開馬爾科夫鏈蒙特卡洛算法的黑盒子,看看它如何工作 利用大數(shù)定律的力量 掌握聚類、收斂、自相關(guān)、細(xì)化等關(guān)鍵概念 根據(jù)目標(biāo)和預(yù)期的結(jié)果,利用損失函數(shù)來推斷缺陷 選擇合理的先驗(yàn),并理解其如何隨著樣本量的大小而變化 克服“研發(fā)與開發(fā)”的困境:判斷是否已經(jīng)足夠好了 利用貝葉斯推斷改良A B測試 在可用數(shù)據(jù)量小的情況下,解決數(shù)據(jù)科學(xué)的問題
作者 Cameron Davidson-Pilon,接觸過數(shù)學(xué)在多個領(lǐng)域的應(yīng)用——從基因和疾病的動態(tài)演化,到金融價格的模型。他對于開源社區(qū)主要的貢獻(xiàn)包括這本書以及l(fā)ifelines項(xiàng)目。Cameron成長于加拿大的安大略省圭爾夫市,而就讀于滑鐵盧大學(xué)以及莫斯科獨(dú)立大學(xué)。如今他住在安大略省渥太華市,并在電商領(lǐng)軍者Shopify工作。 譯者 辛愿,浙江大學(xué)碩士畢業(yè),騰訊公司基礎(chǔ)研究高級工程師,輿情系統(tǒng)開發(fā)經(jīng)理。曾在百度從事推薦系統(tǒng)、用戶畫像、數(shù)據(jù)采集等相關(guān)研究工作,擁有多項(xiàng)專利,組織過上海大數(shù)據(jù)技術(shù)沙龍。目前專注于文本挖掘、輿情分析、智能聊天機(jī)器人等相關(guān)領(lǐng)域。 鐘黎,騰訊公司研究員。曾在中國科學(xué)院、微軟亞洲研究院、IBM研究院(新加坡)從事圖像處理、語音處理、機(jī)器學(xué)習(xí)等相關(guān)研究工作,擁有多項(xiàng)專利,目前聚焦在自然語言處理、深度學(xué)習(xí)和人工智能等相關(guān)領(lǐng)域。 歐陽婷,華南理工大學(xué)碩士畢業(yè),騰訊公司后臺策略工程師。在電信、互聯(lián)網(wǎng)行業(yè)參與過推薦系統(tǒng)、資源優(yōu)化、KPI預(yù)測、用戶畫像等相關(guān)項(xiàng)目,擁有多項(xiàng)專利,目前聚焦在欺詐檢測、時序分析、業(yè)務(wù)安全等相關(guān)領(lǐng)域。 審校者 余凱博士,地平線機(jī)器人技術(shù)創(chuàng)始人、CEO,國際杰出機(jī)器學(xué)習(xí)專家,中組部國家“千人計(jì)劃”專家,中國人工智能學(xué)會副秘書長。余博士是前百度研究院執(zhí)行院長,創(chuàng)建了百度深度學(xué)習(xí)研究院。他在百度所領(lǐng)導(dǎo)的團(tuán)隊(duì)在廣告變現(xiàn)、搜索排序、語音識別、計(jì)算機(jī)視覺等領(lǐng)域做出杰出貢獻(xiàn),創(chuàng)紀(jì)錄地連續(xù)三次獲得公司高榮譽(yù)——“百度獎”。他還創(chuàng)建了中國公司自動駕駛項(xiàng)目,后發(fā)展為百度自動駕駛事業(yè)部。 岳亞丁博士,騰訊公司專家研究員,騰訊技術(shù)職級評委會基礎(chǔ)研究崗位的負(fù)責(zé)委員。岳博士擁有19年在金融、電信、互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)挖掘經(jīng)驗(yàn),主導(dǎo)或參與過用戶畫像、在線廣告、推薦系統(tǒng)、CRM、欺詐檢測、KPI預(yù)測等多種項(xiàng)目。他曾在微軟(加拿大)從事行為定向廣告的模型研發(fā),另有11年的工程結(jié)構(gòu)、海洋水文氣象的力學(xué)研究及應(yīng)用的工作經(jīng)歷。
目錄
第1章貝葉斯推斷的哲學(xué)1
1.1引言1
1.1.1貝葉斯思維1
1.1.2貝葉斯推斷在實(shí)踐中的運(yùn)用3
1.1.3頻率派的模型是錯誤的嗎?4
1.1.4關(guān)于大數(shù)據(jù)4
1.2我們的貝葉斯框架5
1.2.1不得不講的實(shí)例:拋硬幣5
1.2.2實(shí)例:圖書管理員還是農(nóng)民6
1.3概率分布8
1.3.1離散情況9
1.3.2連續(xù)情況10
1.3.3什么是12
1.4使用計(jì)算機(jī)執(zhí)行貝葉斯推斷12
1.4.1實(shí)例:從短信數(shù)據(jù)推斷行為12
1.4.2介紹我們的及時板斧:PyMC14
1.4.3說明18
1.4.4后驗(yàn)樣本到底有什么用?18
1.5結(jié)論20
1.6補(bǔ)充說明20
1.6.1從統(tǒng)計(jì)學(xué)上確定兩個l值是否真的不一樣20
1.6.2擴(kuò)充至兩個轉(zhuǎn)折點(diǎn)22
1.7習(xí)題24
1.8答案24
第2章進(jìn)一步了解PyMC27
2.1引言27
2.1.1父變量與子變量的關(guān)系27
2.1.2PyMC變量28
2.1.3在模型中加入觀測值31
2.1.4……33
2.2建模方法33
2.2.1同樣的故事,不同的結(jié)局35
2.2.2實(shí)例:貝葉斯A B測試38
2.2.3一個簡單的場景38
2.2.4A和B一起41
2.2.5實(shí)例:一種人類謊言的算法45
2.2.6二項(xiàng)分布45
2.2.7實(shí)例:學(xué)生作弊46
2.2.8另一種PyMC模型50
2.2.9更多的PyMC技巧51
2.2.10實(shí)例:挑戰(zhàn)者號事故52
2.2.11正態(tài)分布55
2.2.12挑戰(zhàn)者號事故當(dāng)天發(fā)生了什么?61
2.3我們的模型適用嗎?61
2.4結(jié)論68
2.5補(bǔ)充說明68
2.6習(xí)題69
2.7答案69
第3章打開MCMC的黑盒子71
3.1貝葉斯景象圖71
3.1.1使用MCMC來探索景象圖77
3.1.2MCMC算法的實(shí)現(xiàn)78
3.1.3后驗(yàn)的其他近似解法79
3.1.4實(shí)例:使用混合模型進(jìn)行無監(jiān)督聚類79
3.1.5不要混淆不同的后驗(yàn)樣本88
3.1.6使用MAP來改進(jìn)收斂性91
3.2收斂的判斷92
3.2.1自相關(guān)92
3.2.2稀釋95
3.2.3pymc.Matplot.plot()97
3.3MCMC的一些秘訣98
3.3.1聰明的初始值98
3.3.2先驗(yàn)99
3.3.3統(tǒng)計(jì)計(jì)算的無名定理99
3.4結(jié)論99
第4章從未言明的最偉大定理101
4.1引言101
4.2大數(shù)定律101
4.2.1直覺101
4.2.2實(shí)例:泊松隨機(jī)變量的收斂102
4.2.3如何計(jì)算Var(Z)106
4.2.4期望和概率106
4.2.5所有這些與貝葉斯統(tǒng)計(jì)有什么關(guān)系呢107
4.3小數(shù)據(jù)的無序性107
4.3.1實(shí)例:地理數(shù)據(jù)聚合107
4.3.2實(shí)例:Kaggle的美國人口普查反饋比例預(yù)測比賽109
4.3.3實(shí)例:如何對Reddit網(wǎng)站上的評論進(jìn)行排序111
4.3.4排序!115
4.3.5但是這樣做的實(shí)時性太差了117
4.3.6推廣到評星系統(tǒng)122
4.4結(jié)論122
4.5補(bǔ)充說明122
4.6習(xí)題123
4.7答案124
第5章失去一只手臂還是一條腿127
5.1引言127
5.2損失函數(shù)127
5.2.1現(xiàn)實(shí)世界中的損失函數(shù)129
5.2.2實(shí)例:優(yōu)化“價格競猜”游戲的展品出價130
5.3機(jī)器學(xué)習(xí)中的貝葉斯方法138
5.3.1實(shí)例:金融預(yù)測139
5.3.2實(shí)例:Kaggle觀測暗世界 大賽144
5.3.3數(shù)據(jù)145
5.3.4先驗(yàn)146
5.3.5訓(xùn)練和PyMC實(shí)現(xiàn)147
5.4結(jié)論156
第6章弄清楚先驗(yàn)157
6.1引言157
6.2主觀與客觀先驗(yàn)157
6.2.1客觀先驗(yàn)157
6.2.2主觀先驗(yàn)158
6.2.3決策,決策……159
6.2.4經(jīng)驗(yàn)貝葉斯160
6.3需要知道的有用的先驗(yàn)161
6.3.1Gamma分布161
6.3.2威沙特分布162
6.3.3Beta分布163
6.4實(shí)例:貝葉斯多臂老虎機(jī)164
6.4.1應(yīng)用165
6.4.2一個解決方案165
6.4.3好壞衡量標(biāo)準(zhǔn)169
6.4.4擴(kuò)展算法173
6.5從領(lǐng)域?qū)<姨帿@得先驗(yàn)分布176
6.5.1試驗(yàn)輪盤賭法176
6.5.2實(shí)例:股票收益177
6.5.3對于威沙特分布的專業(yè)提示184
6.6共軛先驗(yàn)185
6.7杰弗里斯先驗(yàn)185
6.8當(dāng)N增加時對先驗(yàn)的影響187
6.9結(jié)論189
6.10補(bǔ)充說明190
6.10.1帶懲罰的線性回歸的貝葉斯視角190
6.10.2選擇退化的先驗(yàn)192
第7章貝葉斯A B測試195
7.1引言195
7.2轉(zhuǎn)化率測試的簡單重述195
7.3增加一個線性損失函數(shù)198
7.3.1收入期望的分析198
7.3.2延伸到A B測試202
7.4超越轉(zhuǎn)化率:t檢驗(yàn)204
7.4.1t檢驗(yàn)的設(shè)定204
7.5增幅的估計(jì)207
7.5.1創(chuàng)建點(diǎn)估計(jì)210
7.6結(jié)論211
術(shù)語表213
包裝都不包裹一下,拿來書都破了
參考書,希望有用
好書,好內(nèi)容。在大數(shù)據(jù)時代尤其對我有幫助
沒有來得及細(xì)看.貌似是未來 的重要發(fā)展趨勢.
值得一讀的好書!
很好不錯…
一本不錯的理論書,挺好
好書推薦好書
值得購買 贊!
AI時代的來臨,貝葉斯發(fā)力了
包裝良好,印制精美。
包裝良好,發(fā)貨及時。舒適正版,我想要的。非常滿意!
居然是彩印的
書看著紙質(zhì)還可以,迫不及待要去學(xué)習(xí)了!
覺得書很不錯
還沒看,好像寫的挺深奧
數(shù)學(xué)基礎(chǔ)需要好好補(bǔ)一補(bǔ)
質(zhì)量超級棒。比起上次的版本來說修正了很多錯誤。可以很全面的理解發(fā)展歷程。這次的版本還是修正版本,讀起來很爽快。作者的功力可以說是絕對的實(shí)力派。這么一大套書估計(jì)要讀整整一年了。不過千里之行始于足下,不積跬步無以至千里。慢慢理解書中內(nèi)容。加油了
很好很好很好
湊滿五個字
13245
很好!!!
還不錯。。值得擁有
感覺很不錯,值得推薦
包裝很好,看完再來評論
還沒看,應(yīng)該可以
書中錯誤不少,還是看英文原版的好,中文的當(dāng)個參考吧
一直以為是主要講方法的,原來主要是講語言的…
這本書其實(shí)非常薄,內(nèi)容還不錯,從基礎(chǔ)開始。適合新手閱讀。最主要的是整本書都是彩色印刷,閱讀體驗(yàn)非常棒。
二百一十多頁,不算厚,排版不錯,彩印,內(nèi)容暫時沒看
重要的顛覆性概念常一筆而過,簡單的地方卻啰嗦。翻一翻
接下來要做算法,貝葉斯也是很有必要學(xué)習(xí)的。很不錯的一本書,內(nèi)容不多,但是知識點(diǎn)都不錯
不錯的書,將統(tǒng)計(jì)思維和統(tǒng)計(jì)建模方法明白地展現(xiàn)出來。還有對Pymc庫使用方法的直接指導(dǎo)。