国产精品日本亚洲777,亚洲人成77777,在线播放国产一区二区三区

內容簡介

本書面向所有對機器學習與數據挖掘的實踐及競賽感興趣的讀者，從零開始，以Python編程語言為基礎，在不涉及大量數學模型與復雜編程知識的前提下，逐步帶領讀者熟悉并且掌握當下流行的機器學習、數據挖掘與自然語言處理工具，如Scikitlearn、NLTK、Pandas、gensim、XGBoost、Google Tensorflow等。

全書共分4章。章簡介篇，介紹機器學習概念與Python編程知識；第2章基礎篇，講述如何使用Scikitlearn作為基礎機器學習工具；第3章進階篇，涉及怎樣借助高級技術或者模型進一步提升既有機器學習系統的性能；第4章競賽篇，以Kaggle平臺為對象，幫助讀者一步步使用本書介紹過的模型和技巧，完成三項具有代表性的競賽任務。

作者簡介

范淼，清華大學計算機系人工智能研究所博士，研究方向涉及機器學習與自然語言處理技術。2015年3月受國家留學基金委公派至美國紐約大學計算機系聯合培養。攻讀博士期間，于所在研究領域內多個重要國際會議與期刊上近20篇。先后在Hulu、MSRA(微軟亞洲研究院)、百度自然語言處理部、Bosch(博世)北美硅谷研究院等多個公司的研發部門實習，并承擔機器學習與自然語言處理相關的研究任務。

李超，工學博士，清華大學副研究員，信息技術研究院Web與軟件技術研究中心副主任。中國計算機學會信息存儲技術專委會委員、中國計算機學會高級會員、全國文獻影像技術標準化技術委員會(SAC/TC86/SC6)委員、IEEE會員。研究領域包括海量數據存儲、組織與管理、分析，及其在數字圖書館/檔案館/教育/醫療/金融等領域的應用。主持及參與多項國家973、863、科技支撐、自然基金等縱向項目及橫向合作項目。已發表學術論文50余篇、獲得授權發明專利10余項。