白化的目的是去除輸入數據的冗余信息。
例如:訓練數據是圖像,由于圖像中相鄰像素之間具有很強的相關(guān)性,因此輸入是冗余的。白化的目的就是降低輸入的冗余性。
輸入數據集,經(jīng)過(guò)白化處理后,生成的新數據集滿(mǎn)足兩個(gè)條件:一是特征相關(guān)性較低;二是特征具有相同的方差。
白化算法的實(shí)現過(guò)程:第一步操作是PCA,求出新特征空間中的新坐標,第二步是對新的坐標進(jìn)行方差歸一化操作。
白化分為PCA白化、ZCA白化,算法實(shí)現步驟如下:
PCA預處理:
左圖表示原始數據X,然后我們通過(guò)協(xié)方差矩陣可以求得特征向量u1、u2,然后把每個(gè)數據點(diǎn),投影到這兩個(gè)新的特征向量(這兩個(gè)特征向量是不變且正交的),得到進(jìn)行坐標如下:
這就是pca處理。
PCA白化
pca白化是指對上面的pca的新坐標X’,每一維的特征做一個(gè)標準差歸一化處理。從上面我們看到在新的坐標空間中,(x1,x2)兩個(gè)坐標軸方向的數據明顯標準差不同,因此我們接著(zhù)要對新的每一維坐標做一個(gè)標注差歸一化處理。
ZCA白化
ZCA白虎是在PCA白化的基礎上,把上面PCA白化的結果,又變換到原來(lái)坐標系下的坐標。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。