《貝葉斯方法 概率編程與貝葉斯推斷》基于PyMC語(yǔ)言以及一系列常用的Python數(shù)據(jù)分析框架,如NumPy、SciPy和Matplotlib,通過(guò)概率編程的方式,講解了貝葉斯推斷的原理和實(shí)現(xiàn)方法。該方法常常可以在避免引入大量數(shù)學(xué)分析的前提下,有效地解決問(wèn)題。書(shū)中使用的案例往往是工作中遇到的實(shí)際問(wèn)題,有趣并且實(shí)用。作者的闡述也盡量避免冗長(zhǎng)的數(shù)學(xué)分析,而讓讀者可以動(dòng)手解決一個(gè)個(gè)的具體問(wèn)題。通過(guò)對(duì)本書(shū)的學(xué)習(xí),讀者可以對(duì)貝葉斯思維、概率編程有較為深入的了解,為將來(lái)從事機(jī)器學(xué)習(xí)、數(shù)據(jù)分析相關(guān)的工作打下基礎(chǔ)。本書(shū)適用于機(jī)器學(xué)習(xí)、貝葉斯推斷、概率編程等相關(guān)領(lǐng)域的從業(yè)者和愛(ài)好者,也適合普通開(kāi)發(fā)人員了解貝葉斯統(tǒng)計(jì)而使用。
國(guó)際杰出機(jī)器學(xué)習(xí)專家、地平線機(jī)器人技術(shù)創(chuàng)始人和CEO、前百度研究院執(zhí)行院長(zhǎng)余凱博士,騰訊專家研究員岳亞丁博士推薦、審校 內(nèi)容涉及Python語(yǔ)言庫(kù)PyMC,以及相關(guān)的工具,包括NumPy\SciPy\Matplotlib,無(wú)需復(fù)雜的數(shù)學(xué)分析,通過(guò)實(shí)例、從編程的角度介紹貝葉斯分析方法,大多數(shù)程序員都可以入門(mén)并掌握。 本書(shū)的內(nèi)容特色: 學(xué)習(xí)貝葉斯思維方式 理解計(jì)算機(jī)如何進(jìn)行貝葉斯推斷 利用PyMC Python庫(kù)進(jìn)行編程來(lái)實(shí)現(xiàn)貝葉斯分析 利用PyMC建模以及調(diào)試 測(cè)試模型的擬合優(yōu)度 打開(kāi)馬爾科夫鏈蒙特卡洛算法的黑盒子,看看它如何工作 利用大數(shù)定律的力量 掌握聚類、收斂、自相關(guān)、細(xì)化等關(guān)鍵概念 根據(jù)目標(biāo)和預(yù)期的結(jié)果,利用損失函數(shù)來(lái)推斷缺陷 選擇合理的先驗(yàn),并理解其如何隨著樣本量的大小而變化 克服“研發(fā)與開(kāi)發(fā)”的困境:判斷是否已經(jīng)足夠好了 利用貝葉斯推斷改良A B測(cè)試 在可用數(shù)據(jù)量小的情況下,解決數(shù)據(jù)科學(xué)的問(wèn)題
作者 Cameron Davidson-Pilon,接觸過(guò)數(shù)學(xué)在多個(gè)領(lǐng)域的應(yīng)用——從基因和疾病的動(dòng)態(tài)演化,到金融價(jià)格的模型。他對(duì)于開(kāi)源社區(qū)主要的貢獻(xiàn)包括這本書(shū)以及l(fā)ifelines項(xiàng)目。Cameron成長(zhǎng)于加拿大的安大略省圭爾夫市,而就讀于滑鐵盧大學(xué)以及莫斯科獨(dú)立大學(xué)。如今他住在安大略省渥太華市,并在電商領(lǐng)軍者Shopify工作。 譯者 辛愿,浙江大學(xué)碩士畢業(yè),騰訊公司基礎(chǔ)研究高級(jí)工程師,輿情系統(tǒng)開(kāi)發(fā)經(jīng)理。曾在百度從事推薦系統(tǒng)、用戶畫(huà)像、數(shù)據(jù)采集等相關(guān)研究工作,擁有多項(xiàng)專利,組織過(guò)上海大數(shù)據(jù)技術(shù)沙龍。目前專注于文本挖掘、輿情分析、智能聊天機(jī)器人等相關(guān)領(lǐng)域。 鐘黎,騰訊公司研究員。曾在中國(guó)科學(xué)院、微軟亞洲研究院、IBM研究院(新加坡)從事圖像處理、語(yǔ)音處理、機(jī)器學(xué)習(xí)等相關(guān)研究工作,擁有多項(xiàng)專利,目前聚焦在自然語(yǔ)言處理、深度學(xué)習(xí)和人工智能等相關(guān)領(lǐng)域。 歐陽(yáng)婷,華南理工大學(xué)碩士畢業(yè),騰訊公司后臺(tái)策略工程師。在電信、互聯(lián)網(wǎng)行業(yè)參與過(guò)推薦系統(tǒng)、資源優(yōu)化、KPI預(yù)測(cè)、用戶畫(huà)像等相關(guān)項(xiàng)目,擁有多項(xiàng)專利,目前聚焦在欺詐檢測(cè)、時(shí)序分析、業(yè)務(wù)安全等相關(guān)領(lǐng)域。 審校者 余凱博士,地平線機(jī)器人技術(shù)創(chuàng)始人、CEO,國(guó)際杰出機(jī)器學(xué)習(xí)專家,中組部國(guó)家“千人計(jì)劃”專家,中國(guó)人工智能學(xué)會(huì)副秘書(shū)長(zhǎng)。余博士是前百度研究院執(zhí)行院長(zhǎng),創(chuàng)建了百度深度學(xué)習(xí)研究院。他在百度所領(lǐng)導(dǎo)的團(tuán)隊(duì)在廣告變現(xiàn)、搜索排序、語(yǔ)音識(shí)別、計(jì)算機(jī)視覺(jué)等領(lǐng)域做出杰出貢獻(xiàn),創(chuàng)紀(jì)錄地連續(xù)三次獲得公司高榮譽(yù)——“百度獎(jiǎng)”。他還創(chuàng)建了中國(guó)公司自動(dòng)駕駛項(xiàng)目,后發(fā)展為百度自動(dòng)駕駛事業(yè)部。 岳亞丁博士,騰訊公司專家研究員,騰訊技術(shù)職級(jí)評(píng)委會(huì)基礎(chǔ)研究崗位的負(fù)責(zé)委員。岳博士擁有19年在金融、電信、互聯(lián)網(wǎng)行業(yè)的數(shù)據(jù)挖掘經(jīng)驗(yàn),主導(dǎo)或參與過(guò)用戶畫(huà)像、在線廣告、推薦系統(tǒng)、CRM、欺詐檢測(cè)、KPI預(yù)測(cè)等多種項(xiàng)目。他曾在微軟(加拿大)從事行為定向廣告的模型研發(fā),另有11年的工程結(jié)構(gòu)、海洋水文氣象的力學(xué)研究及應(yīng)用的工作經(jīng)歷。
目錄
第1章貝葉斯推斷的哲學(xué)1
1.1引言1
1.1.1貝葉斯思維1
1.1.2貝葉斯推斷在實(shí)踐中的運(yùn)用3
1.1.3頻率派的模型是錯(cuò)誤的嗎?4
1.1.4關(guān)于大數(shù)據(jù)4
1.2我們的貝葉斯框架5
1.2.1不得不講的實(shí)例:拋硬幣5
1.2.2實(shí)例:圖書(shū)管理員還是農(nóng)民6
1.3概率分布8
1.3.1離散情況9
1.3.2連續(xù)情況10
1.3.3什么是12
1.4使用計(jì)算機(jī)執(zhí)行貝葉斯推斷12
1.4.1實(shí)例:從短信數(shù)據(jù)推斷行為12
1.4.2介紹我們的及時(shí)板斧:PyMC14
1.4.3說(shuō)明18
1.4.4后驗(yàn)樣本到底有什么用?18
1.5結(jié)論20
1.6補(bǔ)充說(shuō)明20
1.6.1從統(tǒng)計(jì)學(xué)上確定兩個(gè)l值是否真的不一樣20
1.6.2擴(kuò)充至兩個(gè)轉(zhuǎn)折點(diǎn)22
1.7習(xí)題24
1.8答案24
第2章進(jìn)一步了解PyMC27
2.1引言27
2.1.1父變量與子變量的關(guān)系27
2.1.2PyMC變量28
2.1.3在模型中加入觀測(cè)值31
2.1.4……33
2.2建模方法33
2.2.1同樣的故事,不同的結(jié)局35
2.2.2實(shí)例:貝葉斯A B測(cè)試38
2.2.3一個(gè)簡(jiǎn)單的場(chǎng)景38
2.2.4A和B一起41
2.2.5實(shí)例:一種人類謊言的算法45
2.2.6二項(xiàng)分布45
2.2.7實(shí)例:學(xué)生作弊46
2.2.8另一種PyMC模型50
2.2.9更多的PyMC技巧51
2.2.10實(shí)例:挑戰(zhàn)者號(hào)事故52
2.2.11正態(tài)分布55
2.2.12挑戰(zhàn)者號(hào)事故當(dāng)天發(fā)生了什么?61
2.3我們的模型適用嗎?61
2.4結(jié)論68
2.5補(bǔ)充說(shuō)明68
2.6習(xí)題69
2.7答案69
第3章打開(kāi)MCMC的黑盒子71
3.1貝葉斯景象圖71
3.1.1使用MCMC來(lái)探索景象圖77
3.1.2MCMC算法的實(shí)現(xiàn)78
3.1.3后驗(yàn)的其他近似解法79
3.1.4實(shí)例:使用混合模型進(jìn)行無(wú)監(jiān)督聚類79
3.1.5不要混淆不同的后驗(yàn)樣本88
3.1.6使用MAP來(lái)改進(jìn)收斂性91
3.2收斂的判斷92
3.2.1自相關(guān)92
3.2.2稀釋95
3.2.3pymc.Matplot.plot()97
3.3MCMC的一些秘訣98
3.3.1聰明的初始值98
3.3.2先驗(yàn)99
3.3.3統(tǒng)計(jì)計(jì)算的無(wú)名定理99
3.4結(jié)論99
第4章從未言明的最偉大定理101
4.1引言101
4.2大數(shù)定律101
4.2.1直覺(jué)101
4.2.2實(shí)例:泊松隨機(jī)變量的收斂102
4.2.3如何計(jì)算Var(Z)106
4.2.4期望和概率106
4.2.5所有這些與貝葉斯統(tǒng)計(jì)有什么關(guān)系呢107
4.3小數(shù)據(jù)的無(wú)序性107
4.3.1實(shí)例:地理數(shù)據(jù)聚合107
4.3.2實(shí)例:Kaggle的美國(guó)人口普查反饋比例預(yù)測(cè)比賽109
4.3.3實(shí)例:如何對(duì)Reddit網(wǎng)站上的評(píng)論進(jìn)行排序111
4.3.4排序!115
4.3.5但是這樣做的實(shí)時(shí)性太差了117
4.3.6推廣到評(píng)星系統(tǒng)122
4.4結(jié)論122
4.5補(bǔ)充說(shuō)明122
4.6習(xí)題123
4.7答案124
第5章失去一只手臂還是一條腿127
5.1引言127
5.2損失函數(shù)127
5.2.1現(xiàn)實(shí)世界中的損失函數(shù)129
5.2.2實(shí)例:優(yōu)化“價(jià)格競(jìng)猜”游戲的展品出價(jià)130
5.3機(jī)器學(xué)習(xí)中的貝葉斯方法138
5.3.1實(shí)例:金融預(yù)測(cè)139
5.3.2實(shí)例:Kaggle觀測(cè)暗世界 大賽144
5.3.3數(shù)據(jù)145
5.3.4先驗(yàn)146
5.3.5訓(xùn)練和PyMC實(shí)現(xiàn)147
5.4結(jié)論156
第6章弄清楚先驗(yàn)157
6.1引言157
6.2主觀與客觀先驗(yàn)157
6.2.1客觀先驗(yàn)157
6.2.2主觀先驗(yàn)158
6.2.3決策,決策……159
6.2.4經(jīng)驗(yàn)貝葉斯160
6.3需要知道的有用的先驗(yàn)161
6.3.1Gamma分布161
6.3.2威沙特分布162
6.3.3Beta分布163
6.4實(shí)例:貝葉斯多臂老虎機(jī)164
6.4.1應(yīng)用165
6.4.2一個(gè)解決方案165
6.4.3好壞衡量標(biāo)準(zhǔn)169
6.4.4擴(kuò)展算法173
6.5從領(lǐng)域?qū)<姨帿@得先驗(yàn)分布176
6.5.1試驗(yàn)輪盤(pán)賭法176
6.5.2實(shí)例:股票收益177
6.5.3對(duì)于威沙特分布的專業(yè)提示184
6.6共軛先驗(yàn)185
6.7杰弗里斯先驗(yàn)185
6.8當(dāng)N增加時(shí)對(duì)先驗(yàn)的影響187
6.9結(jié)論189
6.10補(bǔ)充說(shuō)明190
6.10.1帶懲罰的線性回歸的貝葉斯視角190
6.10.2選擇退化的先驗(yàn)192
第7章貝葉斯A B測(cè)試195
7.1引言195
7.2轉(zhuǎn)化率測(cè)試的簡(jiǎn)單重述195
7.3增加一個(gè)線性損失函數(shù)198
7.3.1收入期望的分析198
7.3.2延伸到A B測(cè)試202
7.4超越轉(zhuǎn)化率:t檢驗(yàn)204
7.4.1t檢驗(yàn)的設(shè)定204
7.5增幅的估計(jì)207
7.5.1創(chuàng)建點(diǎn)估計(jì)210
7.6結(jié)論211
術(shù)語(yǔ)表213
包裝都不包裹一下,拿來(lái)書(shū)都破了
參考書(shū),希望有用
好書(shū),好內(nèi)容。在大數(shù)據(jù)時(shí)代尤其對(duì)我有幫助
沒(méi)有來(lái)得及細(xì)看.貌似是未來(lái) 的重要發(fā)展趨勢(shì).
值得一讀的好書(shū)!
很好不錯(cuò)…
一本不錯(cuò)的理論書(shū),挺好
好書(shū)推薦好書(shū)
值得購(gòu)買(mǎi) 贊!
AI時(shí)代的來(lái)臨,貝葉斯發(fā)力了
包裝良好,印制精美。
包裝良好,發(fā)貨及時(shí)。舒適正版,我想要的。非常滿意!
居然是彩印的
書(shū)看著紙質(zhì)還可以,迫不及待要去學(xué)習(xí)了!
覺(jué)得書(shū)很不錯(cuò)
還沒(méi)看,好像寫(xiě)的挺深?yuàn)W
數(shù)學(xué)基礎(chǔ)需要好好補(bǔ)一補(bǔ)
質(zhì)量超級(jí)棒。比起上次的版本來(lái)說(shuō)修正了很多錯(cuò)誤。可以很全面的理解發(fā)展歷程。這次的版本還是修正版本,讀起來(lái)很爽快。作者的功力可以說(shuō)是絕對(duì)的實(shí)力派。這么一大套書(shū)估計(jì)要讀整整一年了。不過(guò)千里之行始于足下,不積跬步無(wú)以至千里。慢慢理解書(shū)中內(nèi)容。加油了
很好很好很好
湊滿五個(gè)字
13245
很好!!!
還不錯(cuò)。。值得擁有
感覺(jué)很不錯(cuò),值得推薦
包裝很好,看完再來(lái)評(píng)論
還沒(méi)看,應(yīng)該可以
書(shū)中錯(cuò)誤不少,還是看英文原版的好,中文的當(dāng)個(gè)參考吧
一直以為是主要講方法的,原來(lái)主要是講語(yǔ)言的…
這本書(shū)其實(shí)非常薄,內(nèi)容還不錯(cuò),從基礎(chǔ)開(kāi)始。適合新手閱讀。最主要的是整本書(shū)都是彩色印刷,閱讀體驗(yàn)非常棒。
二百一十多頁(yè),不算厚,排版不錯(cuò),彩印,內(nèi)容暫時(shí)沒(méi)看
重要的顛覆性概念常一筆而過(guò),簡(jiǎn)單的地方卻啰嗦。翻一翻
接下來(lái)要做算法,貝葉斯也是很有必要學(xué)習(xí)的。很不錯(cuò)的一本書(shū),內(nèi)容不多,但是知識(shí)點(diǎn)都不錯(cuò)
不錯(cuò)的書(shū),將統(tǒng)計(jì)思維和統(tǒng)計(jì)建模方法明白地展現(xiàn)出來(lái)。還有對(duì)Pymc庫(kù)使用方法的直接指導(dǎo)。