OpenCV是計算機視覺(jué)開(kāi)源工具中婦孺皆知的,但Dlib絕對是這幾年快速上升的一顆新星,它并不追求大而全,但它實(shí)現的每一個(gè)模塊和特性,都幾乎是高質(zhì)量開(kāi)源算法的典范。
在剛剛結束的PyImageConf2018會(huì )議上,大名鼎鼎的Dlib庫的創(chuàng )建者Davis King做了一個(gè)關(guān)于目標檢測的報告,并舉辦了關(guān)于Dlib的含有40個(gè)新的開(kāi)源Demo的各種計算機視覺(jué)與機器學(xué)習技術(shù)演示的WorkShop。展示了Dlib的強大銳利,是學(xué)習Dlib使用的絕佳資料,作者已將相關(guān)PPT、代碼、數據開(kāi)源,非常值得推薦!
Davis King本尊一直供職于工業(yè)界,熱衷開(kāi)源技術(shù)分享,最近今年尤其關(guān)注于計算機視覺(jué)與深度學(xué)習工具的構建,Dlib庫中無(wú)論是其傳統的HOG+SVM目標檢測、高精度超快速廣泛使用的人臉對齊,還是基于CNN的目標檢測與人臉驗證,Dlib每一次新特性和Demo的添加,幾乎都是將學(xué)術(shù)界state-of-the-art技術(shù)實(shí)用化,令人印象深刻!
這次題為《Finding things in images How does that work? 》的目標檢測報告,作者從滑動(dòng)窗口講到HOG檢測器及其優(yōu)化,并介紹了Dlib中基于圖像金字塔的CNN目標檢測,其速度很快且相比于SSD算法其對小目標檢測性能更好,并分享了影響目標檢測性能的一些因素,比如訓練數據數量和質(zhì)量及超參數的優(yōu)化等,詳細內容PPT查看。
在關(guān)于Dlib使用的WorkShop中,Davis King通過(guò)40個(gè)新的Python例子代碼展示了Dlib解決目標檢測問(wèn)題從數據標注到訓練模型到參數優(yōu)化的方方面面,你會(huì )發(fā)現原來(lái)Python-Dlib這么簡(jiǎn)單(是的,有些功能只需要幾行代碼?。?,作者同時(shí)展示了Dlib中其他一些有趣功能和實(shí)踐示例,每份代碼都值得細讀并在你的機器上跑一遍。



下面是這40個(gè)例子的主要功能:
001——訓練HOG檢測器;
002——運行HOG檢測器;
003——為人臉特征點(diǎn)檢測制作人臉圖像數據和XML文件;
004——訓練人臉特征點(diǎn)檢測模型;
005——運行人臉特征點(diǎn)檢測模型;
006——匈牙利算法;
007——8像素步長(cháng)的HOG檢測;
008——制作包圍盒回歸訓練數據集;
009——訓練目標檢測中包圍盒回歸模型;
010——檢測人臉并進(jìn)行精確的包圍盒回歸定位;
011——全局最優(yōu)化方法(這是Davis King強烈安利的新特性!);
012——訓練包圍盒回歸模型并進(jìn)行超參數搜索;
013——在視頻中檢測人臉并進(jìn)行包圍盒回歸位置提精和卡爾曼濾波;
014——可分離濾波器;
015——訓練nuclear norm的HOG檢測器;
016——運行nuclear norm的HOG檢測器;
017——訓練多個(gè)HOG檢測器;
018——運行多個(gè)HOG檢測器;
019——訓練多個(gè)HOG檢測器并進(jìn)行超參數優(yōu)化;
020——圖像哈希;
021-023——使用聯(lián)通域分析進(jìn)行斑點(diǎn)檢測,并進(jìn)行速度優(yōu)化;
024——邊緣檢測并找直線(xiàn);
025-026——通過(guò)梯度計算亮斑;
027——霍夫變換;
028-034——通過(guò)霍夫變換定位圖像中的紙張;
035——通過(guò)mbd方法定位視頻中旋轉的指尖陀螺;
036——通過(guò)MSER進(jìn)行文本檢測;
037——訓練RBF核的SVM的二類(lèi)問(wèn)題,自動(dòng)優(yōu)化最優(yōu)參數(Dlib中的AutoML);
038——求和運算的緩存SIMD優(yōu)化;
039——多線(xiàn)程數據加載;
040——使用CUDA進(jìn)行矩陣運算加速。
Github地址:
https://github.com/davisking/pyimageconf2018
聯(lián)系客服