《視覺機器學習20講》是計算機、自動化、信息、電子與通信學科方向的專著,詳盡地介紹了K-Means、KNN學習、回歸學習、決策樹學習、Random Forest、貝葉斯學習、EM算法、 Adaboost、SVM方法、增強學習、流形學習、RBF學習、稀疏表示、字典學習、BP學習、CNN學習、RBM學習、深度學習、遺傳算法、蟻群方法等基本理論;深入闡述了視覺機器學習算法的優化方法和實驗仿真;系統地總結了其優點和不足。
本書特別重視如何將視覺機器學習算法的理論和實踐有機地結合,解決視覺機器學習領域中的諸多基礎問題,可應用于醫學圖像分析、工業自動化、機器人、無人車、人臉檢測與識別、車輛信息識別、行為檢測與識別、智能視頻監控等。本書特別重視算法的典型性和可實現性,既包含本領域的經典算法,也包含本領域的研究成果。
本書不僅可作為高年級本科生與研究生教材,而且也是從事視覺機器學習領域研發極為有用的參考資料。
本書是在機器學習領域12位博士多年研究機器學習的基礎理論、核心算法、關鍵技術和應用實踐的科學結晶,是作者們多年相關科研實踐的心得體會和系統總結。
本書從基本理論、實現方法、改進方法、仿真流程、核心代碼、源程序、實驗數據等方面深入淺出地闡述了20個常用機器學習方法,適合于從事醫學圖像分析、工業自動化、機器人、無人車、人臉檢測與識別、車輛信息識別、行為檢測與識別、智能視頻監控等領域的研究生和技術人員。
謝劍斌,博士,教授,國防科學技術大學電子科學與工程學院研究生導師,中國生物特征識別國家標準組委員,中國數字電視國家標準組委員,中國圖像圖形學會高級會員,計算機學會高級會員,電光與控制編委會委員。長期從事海量視頻分析與生物特征識別方面的研究工作,作為項目負責人主持項目8項、部委級項目27項、橫向課題39項。在國內外知名期刊發表學術論文90100多篇,出版專著6部,授權國家發明專利21項、實用新型專利32項。榮獲國際“發明展”金獎2項、湖南省科技進步二等獎1項、公安部技術革新特別項目獎2項、全國“發明展”金獎12項、銅獎1項。
興軍亮,2012年畢業于清華大學計算機科學與技術系,獲工學博士學位,2013年在新加坡國立大學從事博士后研究,現為中國科學院自動化研究所助理研究員,美國電器與電子工程學會(IEEE)會員。研究領域為計算機視覺、模式識別和機器學習,主要研究興趣為視頻中的物體檢測、跟蹤和分割。目前已在重要國際期刊和會議,如TIP,ICCV,CVPR,ACM Multimedia上多篇,譯著兩部。在攻讀博士期間,曾獲得清華大學計算機系學術新秀、清華大學博士論文、清華大學綜合一等獎學金等榮譽稱號和獎勵,在博士后研究期間,帶領學生完成的論文Wow!You are so beautiful today!獲得2013年ACM Multimedia國際會議論文獎。目前作為項目負責人正在主持一項國家自然科學基金項目,作為項目骨干參與了973、863等多項國家重要研究課題以及與惠普、英特爾、歐姆龍等知名企業的多項合作研究課題。
張立寧,2006年和2009年畢業于西安電子科技大學并分別獲學士和碩士學位,2013年畢業于新加坡南洋理工大學電氣與電子工程學院,獲博士學位,現為新加坡科技研究局資訊通信研究院研究員,美國電氣與電子工程師協會會員。研究領域為模式識別與機器視覺,多媒體計算,醫學圖像處理等。目前已在國際重要刊物如IEEE TIP、TCSVT、TSMC-PartB等多篇,參與編輯著作多部。在攻讀碩士和博士學位期間,曾獲多項校學生、畢業生等榮譽稱號,并作為骨干成員參與中國973、863多項重要研究課題以及新加坡多媒體創新的研究項目。
方宇強,2010年畢業于國防科學技術大學控制科學與工程專業,獲得碩士學位,現就讀于國防科學技術大學控制科學與工程專業,攻讀博士學位。2011年赴香港科技大學計算機科學系訪問,2013年在新加坡國立大學計算機系任研究助理。研究領域包括機器學習、計算機視覺和智能系統,主要研究興趣有高維數據特征分析、視覺特征學習和智能無人系統等。在國內外重要期刊和會議,如ICDM、JFR上發表多篇論文,碩士論文獲得湖南省碩士畢業論文。在攻讀博士期間作為項目骨干參與了多項國家973、國家自然科學基金重點項目研究。
李沛秦,博士,講師,任職于國防科學技術大學電子科學與工程學院。長期從事海量視頻分析與生物特征識別方面的研究工作,作為技術骨干參與項目3項,省部級項目13項。在國內外知名期刊發表學術論文25篇,參與出版專著2部,授權國家發明專利12項、實用新型專利25項。榮獲國際發明展金獎2項、湖南省科技進步二等獎1項、公安部技術革新特別項目獎2項、全國“發明展”金獎1項、銅獎1項。
劉通,博士生,講師,任職于國防科學技術大學電子科學與工程學院。長期從事海量視頻分析與生物特征識別方面的研究工作,作為技術骨干參與項目3項,省部級項目17項。在國內外知名期刊發表學術論文29篇,參與出版專著2部,授權國家發明專利12項、實用新型專利25項。榮獲國際“發明展”金獎2項、湖南省科技進步二等獎1項、公安部技術革新特別項目獎2項、全國“發明展”金獎1項、銅獎1項。
閆瑋,博士,講師,任職于國防科學技術大學電子科學與工程學院。長期從事海量視頻分析與生物特征識別方面的研究工作,作為技術骨干參與項目3項,省部級項目15項。在國內外知名期刊發表學術論文23篇,參與出版專著2部,授權國家發明專利12項、實用新型專利25項。榮獲國際“發明展”金獎2項、湖南省科技進步二等獎1項、公安部技術革新特別項目獎2項、全國“發明展”金獎1項、銅獎1項。
王勇,1982年2月生。2005年7月于四川大學數學學院獲學士學位,分別于2007年12月和2011年6月于國防科學技術大學理學院獲碩士和博士學位。2011年7月起在中國空氣動力研究與發展中心低速所任助理研究員。研究興趣包括機器學習、統計學習、模式識別與計算機視覺,論文Multi-manifold clustering于2010年獲亞太人工智能大會論文獎(Best Paper Award),論文Face recognition using Intrinsicfaces被國際期刊Pattern Recognition評選為該刊2010年第二季度最熱門的25篇文章之一(Top 25 Hottest Articles),排行第14。目前主要從事氣動聲學、機器學習等領域的研究工作。
沈杰,博士生,于2011年6月在上海交通大學數學系獲得理學學士學位,多次獲得學業獎學金;2014年3月,在上海交通大學計算機系獲得工學碩士學位,獲得上海市畢業生稱號;從2013年8月至2014年4月,在新加坡國立大學視覺和機器學習實驗室訪問研究;從2014年4月開始,在USA Rutgers大學師從Ping Li教授攻讀博士學位。主要研究人物姿勢識別、物體識別、特征學習和凸優化理論,在凸優化理論的框架下,設計簡單高效的算法。
張政,1983年2月生。2005年7月于空軍及時航空學院獲學士學位,于2007年12月獲國防科學技術大學航天科學與工程學院獲碩士學位,于2012年12月獲南洋理工(Nanyang Technological University)計算機工程學院博士學位。2013年1月起在國防科學技術大學信息系統與管理學院任講師。在IEEE Transactions on Multimedia、ICIP等國際期刊和會議上以及時作者近10篇。研究興趣包括計算機視覺、圖像處理、機器學習等。目前主要從事基于視覺的智能監控、巨量視頻數據處理和分析等領域的研究工作。
譚筠,博士生,2007年畢業于國防科技大學機電工程與自動化學院,獲工學學士學位。2010年暑期,在及時汽車集團公司短期交流學習,合作研制改進了新一代的導航輔助系統。2011年11月至2013年2月獲中國國家留學基金委資助,在新加坡國立大學視覺研究組訪問學習。研究領域為計算機視覺、模式識別和機器學習,主要研究無人駕駛車輛、汽車主動安全產品中的視覺感知問題。作為主要成員,獲得了2011中國智能車未來挑戰賽及時名,ICPR2012人類行為識別與定位大賽及時名等國內、國際獎項。在國際、國內主流會議上發表多篇學術論文,獲得第十屆中國智能機器人學術會議的論文獎。作為項目骨干,參加了國家自然科學基金重大項目、973、863等多項國家重要研究課題。參與開發一系列的汽車主動安全產品,部分已經產業化。
胡俊,1985年6月生。2008年6月于湖南大學電氣與信息工程學院獲學士學位,2011年12月于國防科學技術大學電子科學與工程學院獲碩士學位,并于2012年2月起在國防科學技術大學電子科學與工程學院攻讀博士學位。研究興趣包括信息信號處理、目標檢測、識別與跟蹤。
緒論
第1講 K-means
1.1 基本原理
1.2 算法改進
1.3 仿真實驗
1.4 算法特點
第2講 KNN學習
2.1 基本原理
2.2 算法改進
2.3 仿真實驗
2.4 算法特點
第3講 回歸學習
3.1 基本原理
3.1.1 參數回歸
3.1.2 非參數回歸
3.1.3 半參數回歸
3.2 算法改進
3.2.1 線性回歸模型
3.2.2 多項式回歸模型
3.2.3 主成分回歸模型
3.2.4 自回歸模型
3.2.5 核回歸模型
3.3 仿真實驗
3.3.1 回歸學習流程
3.3.2 基于回歸學習的直線邊緣提取
3.3.3 基于回歸學習的圖像插值
3.4 算法特點
第4講 決策樹學習
4.1 基本原理
4.1.1 分類與聚類
4.1.2 決策樹
4.1.3 信息增益的度量標準
4.1.4 信息增益度量期望的熵降低
4.1.5 悲觀錯誤剪枝
4.1.6 基本決策樹算法
4.2 算法改進
4.2.1 ID3算法
4.2.2 C4.5算法
4.2.3 SLIQ算法
4.2.4 SPRINT算法
4.3 仿真實驗
4.3.1 用于學習布爾函數的ID3算法偽代碼
4.3.2 C4.5算法構造決策樹的偽代碼
4.4 算法特點
第5講 Random Forest學習
5.1 基本原理
5.1.1 決策樹
5.1.2 Bagging集成學習
5.1.3 Random Forest方法
5.2 算法改進
5.3 仿真實驗
5.3.1 Random Forest分類與回歸流程
5.3.2 Forest-RI和For
5.3.3 基于Random Forest的頭部姿態估計
5.4 算法特點
第6講 貝葉斯學習
6.1 基本原理
6.2 算法改進
6.2.1 樸素貝葉斯模型
6.2.2 層級貝葉斯模型
6.2.3 增廣貝葉斯學習模型
6.2.4 基于Boosting技術的樸素貝葉斯模型
6.2.5 貝葉斯神經網絡模型
6.3 仿真實驗
6.3.1 Learn_Bays
6.3.2 Classify_Ba
6.4 算法特點
第7講 EM算法
7.1 基本原理
7.2 算法改進
7.2.1 EM算法的快速計算
7.2.2 未知分布函數的選取
7.2.3 EM算法收斂性的改進
7.3 仿真實驗
7.3.1 EM算法流程
7.3.2 EM算法的偽代碼
7.3.3 EM算法應用——高斯混合模型
7.4 算法特點
第8講 Adaboost
8.1 基本原理
8.1.1 Boosting方法
8.1.2 Adaboost方法
8.2 算法改進
8.2.1 權值更新方法的改進
8.2.2 Adaboost并行算法
8.3 仿真實驗
8.3.1 Adaboost算法實現流程
8.3.2 Adaboost算法示例
8.4 算法特點
8.4.1 Adaboost算法的優點
8.4.2 Adaboost算法的缺點
……
第9講 SVM方法
第10講 增強學習
第11講 流形學習
第12講 RBF學習
第13講 稀疏表示
第14講 字典學習
第15講 BP學習
第16講 CNN學習
第17講 RBM學習
第18講 深度學習
第19講 遺傳算法
第20講 蟻群方法