對于一些研究人員來(lái)說(shuō),獨立成分分析(ICA)在某種程度上可能仍然是難點(diǎn)。ICA算法可以改變數據并產(chǎn)生“更清晰”的信號源。在本文中,我將以BrainVision Analyzer 2中的ICA算法的理論背景,要求和算法以及ICA實(shí)現的進(jìn)行講解。當然,我們無(wú)法解決所有細節,但在本文的最后您肯定會(huì )對該方法有更深入的了解,并希望將ICA算法集合到您的數據處理中。
理論背景
在深入研究方法的復雜性之前,讓我們考慮以下情況:一個(gè)音樂(lè )樂(lè )團在音樂(lè )會(huì )上演奏,你想盡可能產(chǎn)生較少的噪音來(lái)獲取最干凈的信號,但這是一項非常困難的事情。明智地,你在音樂(lè )廳,舞臺和一排排座位上放置并牢固地安裝了幾個(gè)麥克風(fēng)。此外,你可以安全地假設舞臺上的所有演奏者在演唱會(huì )期間都是靜止的(你不希望他們在演奏時(shí)站起來(lái)走動(dòng)),每個(gè)樂(lè )器組都會(huì )播放他們自己的旋律。在一個(gè)激動(dòng)人心的夜晚之后,每個(gè)麥克風(fēng)都會(huì )捕獲混合原始信號的錄音,實(shí)際上您將擁有與麥克風(fēng)一樣多的信號混合。由于麥克風(fēng)放置在音樂(lè )廳,混合信號在不同的麥克風(fēng)上略有不同?,F在你的最終目標是將混合信號分離提取或重建“純信號”。雖然樂(lè )器組演奏的不同旋律當然應該保留,但是應該消除來(lái)自觀(guān)眾的聲音噪音或者其它的一些環(huán)境噪聲。
模型示意圖:

該模型可以以簡(jiǎn)單的方式轉移到EEG記錄上,從腦電圖電極記錄的通道信號(由微伏振幅的時(shí)間序列表示)可以被認為是一組腦信號的混合信號,據推測這些混合信號通過(guò)皮層和皮質(zhì)下區域中的神經(jīng)元簇的同步產(chǎn)生,觸發(fā)遠場(chǎng)電位。雖然神經(jīng)元本身局部是靜止的并且不移動(dòng),但是激活模式基于體積傳導的原理混合和合并,傳播通過(guò)皮層,顱骨和組織的所有層,并且最終存在于任何頭皮部位。同樣,分析的理想結果是混合信號分離開(kāi)逐步分析。

在示例中,目標是從記錄的混合信號中提取統計上的“純信號”,以便允許選擇要保留的信號和丟棄信號。確切地說(shuō),這可以通過(guò)獨立成分分析來(lái)完成(ICA; Makeig et al. 1996)。該技術(shù)已被公認為減輕偽影和分析頭皮和顱內腦電圖記錄中統計獨立皮質(zhì)過(guò)程的有力工具。特別是在EEG數據記錄使用有限的電極中,記錄諸如眨眼或肌肉活動(dòng)的偽跡時(shí)(例如在患者組,兒童或受試者自由移動(dòng)的移動(dòng)EEG實(shí)驗中),ICA可能優(yōu)于偽影閾值去偽。
ICA使用要求:
滿(mǎn)足以下要求,ICA從信號混合信號中提取純信號(詳見(jiàn) Jung et al. 1998):
1.由ICA提取的純信號的特征在于它們的時(shí)間過(guò)程(神經(jīng)激活模式),其在統計上獨立于任何其它信號。事實(shí)上,這些激活是獨立的成分(IC)。
2.純信號(神經(jīng)元簇)的發(fā)生以及記錄位置(電極)在整個(gè)記錄過(guò)程中是靜止的。因此,成分朝向記錄位置的地形位置是固定的。
3.混合是線(xiàn)性的,傳播延遲可以忽略不計。
4.各個(gè)IC激活的概率分布不是精確的高斯分布。
除此之外,ICA沒(méi)有對數據提出任何進(jìn)一步的要求。事實(shí)上,它完全不知道信號的性質(zhì),這就是為什么ICA通常被稱(chēng)為盲源分離算法(Hyv?rinen and Oja 2000)。請記住,IC成分純粹是統計屬性,因此它們不會(huì )將1:1映射到生理過(guò)程。在EEG / MEG數據的背景下,可以基于它們的時(shí)間過(guò)程(和地形分布)來(lái)檢查所提取的IC成分,并且可以去除表示噪聲,偽跡或其它非大腦過(guò)程的IC。然后,校正的一組獨立分量反向逆算,這就可以在電極上修改原始信號,將其中的偽跡信號進(jìn)行校正。
ICA的算法基礎
ICA的數學(xué)基礎,其中包括矩陣運算。通常,我們從電極上記錄的時(shí)間上的混合信號開(kāi)始。電極數據可以表示為2-D矩陣,其中行表示通道,列表示采樣點(diǎn)。矩陣中的值是每個(gè)通道和采樣點(diǎn)的記錄電壓幅值。我們稱(chēng)這個(gè)矩陣為x。我們現在可以生成解混矩陣W(ICA矩陣),當與數據矩陣x相乘時(shí),將混合數據x轉換為IC激活a。
Wx = a
矩陣a的每一行代表一個(gè)成分,每列代表一個(gè)采樣點(diǎn)。成分a的激活可以表征為加權通道激活的線(xiàn)性和。

圖1:使用六個(gè)EEG通道進(jìn)行ICA解混和反演的示意流程圖,產(chǎn)生六個(gè)獨立的成分,每個(gè)成分都具有特定的IC激活和地形
從矩陣表示可以看出,你可以隨時(shí)提取最多與電極一樣多的成分(Makeig等,1997),因為來(lái)自N的混合信號電極被分解成N個(gè)分量的線(xiàn)性加權和。因此,ICA可以表征為完整的分解技術(shù)。這意味著(zhù)可以通過(guò)將IC激活矩陣a乘以逆矩陣來(lái)反演解混合處理。ICA的計算目標是找到一個(gè)解混矩陣W,以便實(shí)現所有成分的最大時(shí)間獨立性 。事實(shí)上,找到W是計算中最耗時(shí)的部分,在BrainVision Analyzer中提供的ICA組件可進(jìn)行數據的計算。
Analyzer中實(shí)現ICA
在進(jìn)行ICA算法時(shí),一般建議是在過(guò)濾數據后進(jìn)行。在Ocular Correction ICA的組件中,Analyzer中已經(jīng)列出了最佳數據預處理步驟和建議,以確定應該使用多少通道和采樣點(diǎn)進(jìn)行有效的ICA分解。這些數據點(diǎn)應標記為“錯誤間隔”,因為ICA忽略了標記為“錯誤間隔”的數據部分。為ICA選擇的數據應包括要分解的相關(guān)信息內容(例如EMG,EOG,ECG偽影)。因此,我建議使用更長(cháng),更有代表性的數據間隔甚至整個(gè)數據(前提是它可以提供內存約束)。而且,為了可視化IC拓撲圖(表示逆矩陣W -1的列),應該存在電極位置。當使用具有未知位置的通道(Radius,Theta,Phi = [0,0,0])時(shí),IC拓撲將保持為空,并且可以?xún)H基于IC激活(矩陣a的行)來(lái)完成計算。一旦您的數據滿(mǎn)足這些要求,您就可以通過(guò)轉換ICA和反向ICA完成ICA解混,IC檢查和選擇以及反演的順序(圖2)。下面將更詳細地描述每個(gè)變換內的步驟。

圖2:轉換步驟ICA和反向ICA
ICA算法將通道數據解混合成時(shí)間上最大獨立分量的計算部分。你可以在Transformations > Frequency and Component Analysis > ICA下找到ICA按鈕。根據轉換對話(huà)框中設置的其余選項,Analyzer完成以下計算步驟。
PCA Sphering(白化):ICA完全忽略了數據的時(shí)間進(jìn)程,而只是檢查了通道數據的分布。為了優(yōu)化ICA中對數據的分布特性,數據被去除(即對于每個(gè)通道計算平均幅度并從每個(gè)采樣點(diǎn)中減去)。通過(guò)這樣做,所有通道的數據分布具有零重疊均值,并且可以以更有效的方式計算測量。
ICA分解:在此步驟中,將白化后的數據應用到ICA算法中,默認情況下混合信號中的最大成分數總是等于通道數。但是,您也可以手動(dòng)指定成分數或將其限制為PCA白化期間特征值超過(guò)特定標準的成分(例如,特征值> 0.001)。軟件默認的ICA算法是Infomax ICA(Bell和Sejnowski 1995; Lee等1999)和FastICA(Hyv?rinen和Oja 2000),它們是應用于EEG數據種的最常見(jiàn)的算法。雖然它們都使用非線(xiàn)性函數系統的迭代擬合以最大化獨立性,但它們在用于評估解混矩陣W的參數方面不同。
**Infomax ICA通過(guò)自然梯度上升識別最佳解混矩陣W. 由于自然梯度上升以無(wú)監視動(dòng)態(tài)搜索最佳解混矩陣W,其中所有提取的分量被同時(shí)測量,每個(gè)ICA運行將產(chǎn)生略微不同的成分集,其中成分序列通常在ICA的不同運行中會(huì )不同。搜索最佳解混矩陣W基于最大化負熵,即隨機變量的不確定性。negentropy的概念與非高斯性和峰度密切相關(guān),因為它們都是最大化的,可以從每個(gè)變量的相互分布中完全預測兩個(gè)或多個(gè)變量的聯(lián)合分布。Restricted Infomax ICA能夠將數據解混為具有正峰值的分量,這對于諸如音樂(lè ),語(yǔ)音和EEG數據之類(lèi)的純信號是典型使用的。Extended Infomax ICA可以解析成分的負峰度,這可能是由屏蔽電流,設備,照明裝置或松動(dòng)的電極接觸引起的AC(交流電)或DC(直流電)噪聲信號的典型值(Delorme等人,2007)。因此,當打算拆分反映生物信號的成分以及反映通道噪聲的成分時(shí),建議使用Extended Infomax ICA。
**FastICA可以被認為是Infomax ICA的計算優(yōu)化版本,它是確定性的,并且總是在不同的運行中產(chǎn)生相同的IC序列(Hyv?rinen和Oja 2000)。Restricted FastICA 通過(guò)最大化負熵的定點(diǎn)算法找到最佳解混矩陣W,extended FastICA基于最大似然估計(Hyv?rinen等人2001; Koldovsky等人2006)。與Infomax ICA的自然梯度方法相比,FastICA算法更快。然而,FastICA算法的速度提高存在一點(diǎn)問(wèn)題,FastICA算法存在“弱”成分的問(wèn)題,即分布接近高斯分布或彼此接近的成分(Chevalier et al.2004) ,這在EEG數據經(jīng)常出現包含這樣的“弱”成分!在這種情況下,FastICA需要更長(cháng)的時(shí)間計算,甚至可能產(chǎn)生不正確的分解。在這種情況下,未混合的成分可能在時(shí)間上不是最大獨立的。這是FastICA算法的主要缺點(diǎn)。
當您按照自動(dòng)模式中的建議應用轉換時(shí),新創(chuàng )建的ICA節點(diǎn)包含已分解的IC激活 - 標記為“F”后跟一個(gè)數字(ICA未選擇的通道將顯示在IC激活下方)。
轉換ICA:檢查成分,選擇和反演
在使用ICA算法計算之后,可以使用轉換ICA來(lái)檢查成分,選擇和反演校正通道,在Transformations > Frequency and Component Analysis> Inverse ICA中找到。如果在自動(dòng)模式下運行此轉換,則會(huì )將所有成反演到通道上,并恢復原始數據。然而,在去偽跡而應用ICA算法時(shí),這是不希望的。在這種情況下,使用半自動(dòng)模式下通過(guò)手動(dòng)的篩查和應用,這是更能準確的反演數據。

圖3:成分F000-F009的[A] IC激活(按系數100縮放)。[B]包含所有成分的反向權重,峰度和能量值的表以及關(guān)于是否將選擇成分用于反演(綠色)或不選擇(紅色)的顏色代碼。在當前示例中,成分已根據其峰度進(jìn)行排序。[C]標準表中突出顯示的F007地形。IC拓撲表示當前所選分量朝向所有通道的標準反權重(無(wú)單位權重,單位可以忽略)。[D]顯示設置。在交互式視圖的這一部分中,您可以調整主窗口中顯示的信息,例如相對于通道幅度的組件縮放等。

圖4:[E]從下拉列表中選擇“校正”將在主窗口中顯示通道數據,其中未進(jìn)行校正數據(表中標記為紅色)。此外,激活復選框“使用原始數據覆蓋”允許比較除偽跡的數據[F]之前(紅色)和之后(黑色)作對比。
總之,在BrainVision Analyzer 2中實(shí)現ICA和Inverse ICA是非常的容易,可以減少基于數據驅動(dòng)方法的EEG記錄中人為過(guò)程的影響。與之前提出的轉換Ocular Correction ICA相比,Ocular Correction ICA主要針對于眨眼眼電的數據,而ICA則不限,這幫助您保留哪些成分以及從數據中刪除哪些成分。
最后,雖然我已經(jīng)介紹了ICA在A(yíng)nalyzer上的使用,當然ICA的理論知識不僅僅是這些,我最近在看Hyv?rinen和Oja兩位所著(zhù)寫(xiě)的《獨立成分分析》中文版一書(shū),足足有450頁(yè)之多,所以說(shuō)這不僅僅是一次推送就能完全了解ICA的歷史及算法。
主要參考:
Hyv?rinen A, Karhunen J, and Oja E. Indepenent Component Analysis. New York: Wiley & Sons, 2001.
Hyv?rinen A, and Oja E. Independent component analysis: Algorithms and applications. Neural Networks 13: 411-430, 2000.
Brain Products 官網(wǎng)
聯(lián)系客服