自然語言處理(Natural Language Processing,NLP)是計算機科學領域與人工智能領域中的一個重要方向。它研究能夠實現人與計算機之間用自然語言進行有效通信的各種理論和方法,涉及所有用計算機對自然語言進行的操作。
《Python自然語言處理》是自然語言處理領域的一本實用入門指南,旨在幫助讀者學習如何編寫程序來分析書面語言。《Python自然語言處理》基于Python編程語言以及一個名為NLTK的自然語言工具包的開源庫,但并不要求讀者有Python編程的經驗。全書共11章,按照難易程度順序編排。第1章到第3章介紹了語言處理的基礎,講述如何使用小的Python程序分析感興趣的文本信息。第4章討論結構化程序設計,以鞏固前面幾章中介紹的編程要點。第5章到第7章介紹語言處理的基本原理,包括標注、分類和信息提取等。第8章到第10章介紹了句子解析、句法結構識別和句意表達方法。第11章介紹了如何有效管理語言數據。后記部分簡要討論了NLP領域的過去和未來。
《Python自然語言處理》的實踐性很強,包括上百個實際可用的例子和分級練習。《Python自然語言處理》可供讀者用于自學,也可以作為自然語言處理或計算語言學課程的教科書,還可以作為人工智能、文本挖掘、語料庫語言學等課程的補充讀物。
Python自然語言處理方面的之作
快速了解一些概念及基本工作原理的必讀
提供豐富英文語料庫和代碼,方便練習
從輸入法聯想提示(predictive text)、email過濾到自動文本匯總、機器翻譯,大量的語言相關的技術都離不開自然語言處理的支持,而這本書提供了自然語言處理的入門指南。通過本書,你將學到如何編寫能處理大量非結構化文本的Python程序。你可以訪問具有豐富標注的、涵蓋了語言學各種數據結構的數據集,而且你將學習分析書面文檔的內容以及結構的主要算法。
通過大量的例子和練習,本書將幫助你:
從非結構化文本中提取信息,無論是猜測主題還是識別“命名實體”;
分析文本的語言學結構,包括語法和語義分析;
訪問流行的語言學數據集,包括WordNet和treebanks;
整合從語言學到人工智能等多個領域的技術。
通過使用Python程序設計語言和自然語言工具包(NTLK)的開源庫,本書將幫助你增加自然語言處理的實際經驗。如果你對開發Web應用、分析多語言的新聞源或編制瀕危語言感興趣,或者只是想要從程序員的視角看人類語言如何運作,你將發現本書不僅有趣而且極其有用。
Steven Bird是墨爾本大學計算機科學和軟件工程系副教授,賓夕法尼亞大學語言學數據聯盟高級研究助理。
Ewan Klein是愛丁堡大學信息學院語言技術教授。
Edward Loper是畢業于賓夕法尼亞大學專注于機器學習的自然語言處理方向的博士,現在在波士頓的BBN Technologies擔任研究員。
第1章語言處理與Python
1.1語言計算:文本和詞匯
1.2近觀Python:將文本當做詞鏈表
1.3計算語言:簡單的統計
1.4回到Python:決策與控制
1.5自動理解自然語言
1.6小結
1.7深入閱讀
1.8練習
第2章獲得文本語料和詞匯資源
2.1獲取文本語料庫
2.2條件頻率分布
2.3更多關于Python:代碼重用
2.4詞典資源
2.5WordNet
2.6小結
2.7深入閱讀
2.8練習
第3章處理原始文本
3.1從網絡和硬盤訪問文本
3.2字符串:最底層的文本處理
3.3使用Unicode進行文字處理
3.4使用正則表達式檢測詞組搭配
3.5正則表達式的有益應用
3.6規范化文本
3.7用正則表達式為文本分詞
3.8分割
3.9格式化:從鏈表到字符串
3.10小結
3.11深入閱讀
3.12練習
第4章編寫結構化程序
4.1回到基礎
4.2序列
4.3風格的問題
4.4函數:結構化編程的基礎
4.5更多關于函數
4.6程序開發
4.7算法設計
4.8Python庫的樣例
4.9小結
4.10深入閱讀
4.11練習
第5章分類和標注詞匯
5.1使用詞性標注器
5.2標注語料庫
5.3使用Python字典映射詞及其屬性
5.4自動標注
5.5N-gram標注
5.6基于轉換的標注
5.7如何確定一個詞的分類
5.8小結
5.9深入閱讀
5.10練習
第6章學習分類文本
6.1監督式分類
6.2監督式分類的舉例
6.3評估
6.4決策樹
6.5樸素貝葉斯分類器
6.6較大熵分類器
6.7為語言模式建模
6.8小結
6.9深入閱讀
6.10練習
第7章從文本提取信息
7.1信息提取
7.2分塊
7.3開發和評估分塊器
7.4語言結構中的遞歸
7.5命名實體識別
7.6關系抽取
7.7小結
7.8深入閱讀
7.9練習
第8章分析句子結構
8.1一些語法困境
8.2文法的用途
8.3上下文無關文法
8.4上下文無關文法分析
8.5依存關系和依存文法
8.6文法開發
8.7小結
8.8深入閱讀
8.9練習
第9章建立基于特征的文法
9.1文法特征
9.2處理特征結構
9.3擴展基于特征的文法
9.4小結
9.5深入閱讀
9.6練習
第10章分析語句的含義
10.1自然語言理解
10.2命題邏輯
10.3一階邏輯
10.4英語語句的語義
10.5段落語義層
10.6小結
10.7深入閱讀
10.8練習
第11章語言數據管理
11.1語料庫結構:案例研究
11.2語料庫生命周期
11.3數據采集
11.4使用XML
11.5使用Toolbox數據
11.6使用OLAC元數據描述語言資源
11.7小結
11.8深入閱讀
11.9練習
后記
參考文獻
“少有的一本書,用如此清晰的方法如此優美整潔的代碼處理一個如此復雜的計算機問題……這是一本從中可以學習自然語言處理的書。”
——Ken Getz, MCW Technologies高級顧問
書是湊合,我本身要求店家開一個普通發票,有稅號的就行,用于學校報銷,店家給我開的發票沒按我的要求,沒稅號,聯系客服,告訴我月底開。結果到月底,說還是開不了,要我把發票寄回去,重新開,郵費還要我自己掏。同一時間我在當當買了另一本書,人家店家就開的合適。而你們這家一開始就推脫我,一點誠意都沒有,到月底還讓我自己把發票寄回去。差評。。糟心的一次購物
很好,質量不錯,實用性強專業性強好。
內容不錯,和我想的不太一樣
要好好學習
喜歡python的喜歡數據挖掘的朋友可以看一下
是根據影印版翻譯的,其實建議看網頁上的最新版...
期待已久的一本書,國內終于引進了。網上之前有人義務翻譯了一個電子版,很贊
書很不錯,只是包裝太單薄,兩本書都被磨的很厲害,快遞太不負責了。
有幾處黏頁的現象,用手輕輕撕開,個別字也被撕掉了
還不錯,不過原作者是外國人,處理都是英文,如果來做中文的話,還是需要更進一步的努力!
理論與實踐結合相當緊密,將PYTHON編程落實到NLP各個方面,有利于讀者掌握NLTK。
慢慢看,雖然以前沒接觸過,但總得學點什么不是嗎
實用性強,推薦。對于初學或入門級的讀者都考慮到,書的內容編排對讀者很友好。
書很好,但是翻譯的不太好,網站有英文版適用Python3的教程
好書,實踐性很強,python是無所不能的,適合擴充python的知識,有一定難度
雖然是英文翻譯過來的,但是總體思想還是值得一看的
不錯,挺實用的,但是需要一定的Python的基礎
從最基本的金融數據分析工具入手,可以很快的上手python數據分析
好,對于實戰較好。解決課程實驗,與報告,很有幫助。
在學習Python 機器學習,這本書非常適合
統計專業R已經不夠用了,必須要學習Python了。。。。老師推薦用書。
這是一本很不錯的值得學習的書,比較系統和全面,只是更多的是對英文的語言處理,收益很多
很適合python和自然語言處理的初學者,內容深入淺出,一開始對基礎知識幾乎沒有什么要求,學過編程的話更容易上手
還沒看,不過應該要看啦!Python還是比較好用的!
這本書簡述了python2.x的一些簡單的語法與使用,只要具備了一部分編程基礎的人都能在短期內迅速上手,這樣可以把更多的時間放在語言處理上。
主要介紹英文自然語言的數據挖掘,很詳細,要是能介紹中文文本的數據挖掘就更好,畢竟中文比英文更難挖掘分析
《Python自然語言處理》是關于python進階的教材,涉及到大量自然語言處理的實際應用案例,具有極強的參考價值和學習價值,非常值得購買。
很好啊,這本書非常經典,六一兒童節優惠很大,一次性買了好多。書真的不錯,尤其是內容