本書將介紹如何使用Python編寫網絡爬蟲程序獲取互聯網上的大數據。本書包括三部分內容:基礎部分、進階部分和項目實踐?;A部分(第1~6章)主要介紹爬蟲的三個步驟(獲取網頁、解析網頁和存儲數據),并通過諸多示例的講解,讓讀者從基礎內容開始系統性地學習爬蟲技術,并在實踐中提升Python爬蟲水平。進階部分(第7~12章)包括多線程的并發和并行爬蟲、分布式爬蟲、更換IP等,幫助讀者進一步提升爬蟲水平。項目實踐部分(第13~16章)使用本書介紹的爬蟲技術對幾個真實的網站進行抓取,讓讀者能在讀完本書后根據自己的需求寫出爬蟲程序。無論是否有編程基礎,只要是對爬蟲技術感興趣的讀者,本書就能帶領讀者從入門到進階,再到實戰,一步步了解爬蟲,終寫出自己的爬蟲程序。
推薦序
推薦序二
前言
前言二
第1章網絡爬蟲入門
1.1為什么要學網絡爬蟲
1.1.1 網絡爬蟲能帶來什么好處
1.1.2能從網絡上爬取什么數據
1.1.3應不應該學爬蟲
1.2網絡爬蟲是否合法
1.2.1 Robots協議
1.2.2 網絡爬蟲的約束
1.3網絡爬蟲的基本議題
1.3.1 Python爬蟲的流程
1.3.2三個流程的技術實現
2章編寫及時個網絡爬蟲
2.1搭建Python平臺
2.1.1 Python的安裝
2.1.2使用pip安裝第三方庫
2.1.3使用編譯器Jupyter編程
2.2 Python使用入門
2.2.1基本命令
2.2.2數據類型
2.2.3條件語句和循環語句
2.2.4函數
2.2.5面向對象編程
2.3編寫及時個簡單的爬蟲
第3章靜態網頁抓取
第4章動態網頁抓取
第5章解析網頁
第6章數據存儲
第7章提升爬蟲的速度
第8章反爬蟲問題
第9章解決中文亂碼
第10章登錄與驗證碼處理
第11章服務器采集
第12章分布式爬蟲
第13章爬蟲實踐一:維基百科
第14章爬蟲實踐二:知乎Live
第15章爬蟲實踐三:百度地圖API
第16章爬蟲實踐四:餐廳點評
寫的不錯,推薦購買!
一般般,一般般
快遞丟件沒有收到貨物
雖然本書中有一個出版的錯誤,但作者很負責的在博客網站上做了勘誤說明,書的內容先大后小,入門爬蟲挺好的。
不錯,贊贊贊
!?。。。?!
比較淺,適合入門
不錯,語言通俗易懂,學起來比較輕松,值得推薦
書不錯,很實用,很好學。
超級超級棒,說的非常到位???
書很好對我的幫助很大
文筆很好,通俗易懂,挺適合年輕人看的。
非常的一個研究技術工具!!
文筆很好,通俗易懂,技術覆蓋全面,挺適合年輕人看的。
剛買了這本書,寫得不錯!對照書中的示例,很容易上手練習!
本書內容實翔,案例分析透徹,適合基礎學習用書,入門人員提升用書。
這本書很實用,無論你是否有一定的編程基礎,只要你對爬蟲技術感興趣,它能帶領我們成為網絡爬蟲高手!作者用通俗易懂的語言,讓我這個50歲的老娘也想成為網絡爬蟲高手!網絡時代需要它!