本文提出了一種采用卷積神經(jīng)網(wǎng)絡(luò )(CNN)的帕金森癥(Parkinson's disease,PD)自動(dòng)檢測系統。PD的特征是大腦中運動(dòng)功能的逐漸退化。由于它與腦異常有關(guān),腦電圖(EEG)信號通常被考慮用于早期診斷。在本研究中,我們使用了20個(gè)PD和20個(gè)正常受試者的腦電圖信號。實(shí)現了一種可以克服傳統特征表示階段需求的13層CNN架構。該模型具有88.25%的準確率、84.71%的靈敏度和91.77%的特異性。在安裝臨床使用之前,已開(kāi)發(fā)的分類(lèi)模型已準備好用于大量受試者。本文于發(fā)表在Neural Computing and Applications。(可添加微信號siyingyxf或18983979082獲取原文)。關(guān)鍵詞:計算機輔助檢測系統 卷積神經(jīng)網(wǎng)絡(luò ) 深度學(xué)習 帕金森病思影科技曾做過(guò)多期關(guān)于腦電機器學(xué)習相關(guān)的文章解讀,可結合閱讀,直接點(diǎn)擊下文鏈接(紅色為我個(gè)人特別推薦的文章):
腦電信號處理的機器學(xué)習
EEG分類(lèi)實(shí)驗block設計的危險與陷阱
Current Biology:視覺(jué)想象和視覺(jué)感知共享Alpha頻帶中的神
利用腦電連通性特征和卷積神經(jīng)網(wǎng)絡(luò )的情緒分類(lèi)
腦電研究:通過(guò)神經(jīng)活動(dòng)和視覺(jué)特征的多模態(tài)學(xué)習
JAMA Psychiatry:使用機器學(xué)習的方法探究焦慮和創(chuàng )傷性障
Nature neuroscience:利用encoder-decoder模型實(shí)現皮層活
ANNALS of Neurology:中風(fēng)恢復過(guò)程中腦機接口可促進(jìn)運動(dòng)
Nature Biotechnology: EEG特征預測重度抑郁癥的抗抑郁藥反應
BMC Medicine:自閉癥譜系障礙靜息態(tài)EEG信號的定量遞歸
SCIENCE ROBOTICS:非侵入式神經(jīng)成像可增強機器控制
Lancet Neurology:一種供四肢癱瘓患者使用硬膜外無(wú)線(xiàn)腦機
Lancet經(jīng)典:植物人意識狀態(tài)的床邊檢測
NATURE子刊:出生第一年的縱向EEG power能識別孤獨癥譜
EEG機器學(xué)習:急性腦損傷臨床無(wú)反應患者腦
STROKE:用于慢性中風(fēng)患者運動(dòng)康復的動(dòng)力外骨骼的健側腦-機
PNAS:基于腦電在線(xiàn)神經(jīng)反饋調節喚醒程度可以改善個(gè)體
帕金森病認知圖譜的EEG機器學(xué)習
BRAIN:機器學(xué)習:基于EEG的跨中心、跨方案的意識
腦機接口訓練可持久地恢復中風(fēng)病人的上肢運動(dòng)功能
人類(lèi)的大腦在出生時(shí)包含最大數量的神經(jīng)細胞,也稱(chēng)為神經(jīng)元。PD通常伴隨著(zhù)神經(jīng)元的死亡。神經(jīng)元產(chǎn)生一種化學(xué)物質(zhì),稱(chēng)為多巴胺,其主要功能是控制身體的運動(dòng)。因此,隨著(zhù)神經(jīng)元的死亡,大腦中產(chǎn)生的多巴胺數量減少。因此,這種神經(jīng)狀況開(kāi)始逐漸發(fā)生,并影響到大腦中的各種溝通模式。據觀(guān)察,50歲或50歲以上的人會(huì )被診斷出患有PD。這種疾病的主要癥狀是姿勢不穩定、肌肉僵硬、動(dòng)作緩慢、震顫、平衡喪失和精細運動(dòng)技能受損。根據世界衛生組織提供的統計數字,這種疾病已奪走近1000萬(wàn)人的生命。當沒(méi)有觀(guān)察到明顯的運動(dòng)或非運動(dòng)癥狀時(shí),診斷該疾病有困難。因此,計算機輔助診斷(CAD)系統可能有助于早期發(fā)現異常。CAD系統是一種利用腦電信號客觀(guān)診斷PD的自動(dòng)化檢測系統。大腦皮層和皮層下部分的功能很容易通過(guò)腦電圖來(lái)識別。神經(jīng)系統疾病,如癲癇,精神分裂癥,阿爾茨海默病也可以用腦電圖信號來(lái)確定。因此,我們在本研究中利用腦電信號開(kāi)發(fā)了檢測PD的CAD系統。根據以往的研究,腦電信號本質(zhì)上是復雜和非線(xiàn)性的,因此,許多線(xiàn)性特征提取方法無(wú)法準確地描述這些信號。當腦電信號顯示復雜性時(shí),PD會(huì )加重。這是由于腦電信號中存在的非線(xiàn)性分量。因此,非線(xiàn)性特征提取技術(shù)的應用將有助于區分正常和PD的EEG信號。然而,機器學(xué)習的一個(gè)分支稱(chēng)為深度學(xué)習,近年來(lái),在模式識別和自然語(yǔ)言處理的多個(gè)領(lǐng)域得到了成功的應用。卷積神經(jīng)網(wǎng)絡(luò )(CNN)是研究人員采用的最流行的深度學(xué)習框架之一。與大多數傳統的機器學(xué)習算法不同,它允許通過(guò)訓練數據來(lái)學(xué)習更高層次的特征,而不需要人為干預。據我們所知,這是第一篇針對PD的CAD(計算機輔助診斷)系統實(shí)現深度CNN的論文。我們已經(jīng)實(shí)現了一個(gè)新的十三層深度CNN來(lái)描述這兩個(gè)類(lèi)別(PD和正常)。圖1是提出的網(wǎng)絡(luò )的體系結構。網(wǎng)絡(luò )和每個(gè)層的詳細信息將在后面的章節中介紹。它是一種將特征提取和分類(lèi)過(guò)程有效結合起來(lái)的機器學(xué)習類(lèi)型。從輸入數據中提取的特征被用來(lái)建立一個(gè)魯棒的CNN模型,然后在測試階段測試所開(kāi)發(fā)模型的診斷性能。CNN模型在Acharya等人最近的論文中分別使用腦電信號自動(dòng)檢測癲癇和抑郁癥,取得了成功。2.1 卷積神經(jīng)網(wǎng)絡(luò )CNN的基本層包括卷積、最大池化層和完全連接(密集)層。通常,隨著(zhù)網(wǎng)絡(luò )的深入,網(wǎng)絡(luò )往往會(huì )學(xué)得更好。然而,這可能會(huì )影響計算時(shí)間。因此,我們仔細設計了需要較短計算時(shí)間的網(wǎng)絡(luò )體系結構。在訓練階段對參數進(jìn)行精細調整,得到了最高的分類(lèi)性能。卷積層使用核(窗口)與輸入信號卷積。卷積后生成下一層的特征映射。之后,采用批處理歸一化層對輸入的訓練數據進(jìn)行歸一化,使其在中間層之間流動(dòng),目的是使學(xué)習更快。然后,將校正后的線(xiàn)性單元應用于輸入數據的閾值,減少了數據中的冗余。為了減少特征映射的大小,使用了最大池化層。最后,最大池化層的每個(gè)神經(jīng)元都連接到完全連接層中的每個(gè)神經(jīng)元,輸出預測輸入信號的結果(正?;?/span>PD)。所提出的體系結構的概述如圖1所示。模型的驗證分為兩個(gè)步驟進(jìn)行:首先,訓練數據,然后對模型進(jìn)行測試。在訓練過(guò)程中,引入分層十折交叉驗證,其中完整的數據被分成10等份。在10個(gè)部分中,9個(gè)用于訓練模型,其余部分用于測試。這個(gè)過(guò)程被迭代了十次,這樣所有部分都將涉及到訓練和測試階段。第二,為了評估每個(gè)部分結束時(shí)訓練的進(jìn)展,分配了20%的交叉驗證訓練數據來(lái)驗證模型。使用學(xué)習率為0.0001的Adam優(yōu)化(Adam雖然可以自動(dòng)調整學(xué)習率,可是初始學(xué)習率過(guò)大,很可能直接收斂到很差的局部最小值點(diǎn),而后面的學(xué)習因為學(xué)習率已經(jīng)被降低,就再也跳不出去了。所以不宜過(guò)大。一般的框架中,默認學(xué)習率1e-3。),我們已經(jīng)使用了一些激活函數,例如所有層的Relu和最后一層的Softmax。對于dropout層,dropout值設置為0.5。表1顯示了所有層的內部細節。所有參數都相應地調整到訓練集,只要給出最佳的訓練精度。通過(guò)蠻力法(也稱(chēng)為窮舉法或枚舉法)得到核大小和濾波器個(gè)數。如果您對腦電及其他心理認知研究數據處理感興趣,歡迎瀏覽思影科技課程及服務(wù)(可添加微信號siyingyxf或18983979082咨詢(xún)):
第二屆腦電機器學(xué)習數據處理班(南京,4.6-11)
第八屆腦電信號數據處理提高班(南京,3.29-4.3)
第十二屆腦電數據處理入門(mén)班(南京,3.19-24)
第十一屆近紅外腦功能數據處理班(上海,4.13-18)
第九屆眼動(dòng)數據處理班(上海,4.6-11)
第十三屆腦電數據處理入門(mén)班(上海,4.19-24)
經(jīng)醫院倫理委員會(huì )批準,采集年齡在45歲至65歲之間的20例PD患者(10名女性和10名男性)的腦電圖信號。這些患者的PD平均周期為5.75±3.52年(從1后到12年不等)。Hoehn和Yahr階段[30]如下:輕微的精神狀態(tài)檢查(mini-mental status examination,MMSE)發(fā)現被試在正常限制范圍內[26.90±1.51(范圍25-30)]。排除包括存在其他神經(jīng)疾病的被試,如癲癇或精神疾病,抑郁癥和其他急性精神障礙。一共招募了20名同年齡組的正常人(9名男性和11名女性,平均年齡為58.10±2.95歲),沒(méi)有過(guò)去的神經(jīng)或精神障礙記錄或跡象。健康參與者的MMSE結果為27.15±1.63年。被試都是右利手。此外,這些受試者聽(tīng)力正常,參與者通過(guò)向他們解釋所涉風(fēng)險的可能性,尋求對這項研究的同意。記錄在靜息狀態(tài)下持續5分鐘(放松覺(jué)醒狀態(tài))的EEG,采樣率為128Hz。使用emotive EPOC的14導電極帽。參與者被要求舒適地坐在安靜的房間里,并在實(shí)驗前被告知在實(shí)驗期間不要進(jìn)行身體運動(dòng)(例如眨眼)。實(shí)驗后,將信號分割成2s窗口長(cháng)度。采用閾值技術(shù)刪除超過(guò)±100uV的信號來(lái)去除眨眼偽跡。然后,采用六階帶通巴特沃斯濾波技術(shù),濾波頻率范圍為1-49赫茲。最后,對1588個(gè)無(wú)偽跡部分進(jìn)行了進(jìn)一步分析。圖2顯示了正常和PD腦電圖記錄樣本。圖2 正常和PD被試的EEG信號
所有腦電信號均采用CNN模型,采用Python語(yǔ)言的Keras,在一臺系統配置為兩個(gè)Intel Xeon2.40GHz(E5620)處理器的計算機上執行,具有24GB的隨機訪(fǎng)問(wèn)內存。本文采用了以下評價(jià)參數,即準確性、靈敏度和特異性。學(xué)習率為0.0001,達到最佳診斷性能。所提出的CNN模型的準確率為88.25%,靈敏度和特異性分別為84.71%和91.77。圖3和圖4分別顯示了有無(wú)dropout層的模型的性能??梢园l(fā)現,如果沒(méi)有dropout層,數據就有可能出現過(guò)擬合。在圖3中,訓練集的準確性與驗證集的準確性沒(méi)有太大的區別,而在圖4中,驗證集的準確性比訓練數據要差得多。圖5顯示了我們的結果的混淆矩陣??梢园l(fā)現,11.34%的正常受試者被錯誤地歸類(lèi)為PD,11.51%的PD被錯誤地歸類(lèi)為正常。圖3 不同分段數量的預測準確性
圖4 沒(méi)有dropout時(shí)的不同分段數量的預測準確性
圖5 本研究的混淆矩陣
在過(guò)去的幾年里,人們提出了幾種無(wú)創(chuàng )技術(shù)來(lái)識別PD,如使用語(yǔ)音和步態(tài)信號,探索了不同的自動(dòng)化技術(shù),開(kāi)發(fā)最佳的自動(dòng)化模型,以區分正常和PD受試者。Chen等人認為特征約簡(jiǎn)法可以消除PD語(yǔ)音信號中不必要的信息。此外,他們還報告了使用主成分分析特征簡(jiǎn)約技術(shù)和模糊k近鄰(FKNN)分類(lèi)器的平均診斷準確率為96.07。后來(lái),Zuo等提高了精度,采用蜂群智能算法,輔以FKNN分類(lèi)器對正常和PD語(yǔ)音信號進(jìn)行分類(lèi)。此外,Ma等提出了一種將聚類(lèi)算法與基于核的極端機器學(xué)習分類(lèi)器相結合的方法來(lái)表征來(lái)自正常語(yǔ)音信號與PD語(yǔ)音信號,平均準確率為99.49%。另一方面,Daliri采用基于傅里葉變換對正常步態(tài)和PD步態(tài)信號進(jìn)行分類(lèi)的特征判別法,分類(lèi)準確率達到91.20%。然而,使用腦電信號診斷PD的研究數量有限。根據所進(jìn)行的研究(見(jiàn)表2),可以注意到,在正常和PD受試者中,采用了各種機器學(xué)習技術(shù)來(lái)區分腦電信號。Han等進(jìn)行了一個(gè)實(shí)驗,以研究正常和PD腦電信號的特點(diǎn)。他們報告說(shuō),PD的腦電圖信號的熵值明顯高于正常的腦電圖信號,這表明PD腦電信號更加復雜。Yuvaraj等采用高階統計量(higherorder statistics,HOS)特征提取技術(shù)來(lái)區分這兩類(lèi)信號。據報道,HOS可以很好地表示PD EEG信號中隱藏的非線(xiàn)性特征以用來(lái)分類(lèi)。然而,在本研究中,我們提出了一種深度CNN架構來(lái)檢測PD。這種方法的新穎之處在于建立了一個(gè)十三層網(wǎng)絡(luò ),利用腦電信號區分PD和正常人。此外,本研究不需要手工挑選特征。這大大減少了實(shí)驗和選擇最佳特征集進(jìn)行分類(lèi)的過(guò)程。此外,為了進(jìn)一步提高CAD(計算機輔助診斷)系統的效率,我們提出了一種基于網(wǎng)絡(luò )的診斷技術(shù)。圖6描述了基于網(wǎng)絡(luò )的CAD系統的工作流程。本系統利用互聯(lián)網(wǎng)對PD患者進(jìn)行診斷。從患者收集的腦電信號存儲在診所的本地存儲服務(wù)器中,并通過(guò)云端發(fā)送給我們開(kāi)發(fā)的CNN模型,診斷結果從云端發(fā)回診所。此外,這種基于網(wǎng)絡(luò )的應用程序的優(yōu)點(diǎn)是診斷結果可以通過(guò)短信直接發(fā)送給病人。因此,隨著(zhù)這一系統的安裝,診所的臨床醫生將能夠大大減少他們的工作量。圖6 基于云端的CAD系統的PD診斷
該技術(shù)的主要優(yōu)點(diǎn)是:1.設計了13層CNN模型,利用腦電信號自動(dòng)識別PD。2.在所提出的CNN模型中,不需要對特征進(jìn)行提取、選擇和分類(lèi)。3.用分層十折交叉驗證技術(shù)對模型進(jìn)行了驗證。4.這是首次實(shí)現利用腦電信號檢測PD的深度學(xué)習技術(shù)。5. 即使在正常和PD受試者較少的情況下,它也能獲得良好的性能。因此,魯棒性好。1.它使用有限數量的(20正常和20PD)受試者來(lái)開(kāi)發(fā)CNN模型。2.與傳統的機器學(xué)習技術(shù)相比,CNN結構的計算成本很高。在未來(lái),作者打算使用開(kāi)發(fā)的模型與龐大的數據庫,從不同的種族和年齡組來(lái)進(jìn)行分類(lèi)。此外,這些技術(shù)還可以用來(lái)檢測其他大腦異常,如自閉癥、阿爾茨海默病、抑郁癥和睡眠障礙。提出了一種利用腦電信號診斷PD的13層CNN自動(dòng)模型。此外,這是第一次實(shí)施深度學(xué)習概念來(lái)診斷PD的腦電信號。盡管受試者數量有限,我們獲得了88.25%的準確性,84.71%的敏感性,91.77%的特異性?;谒@得的良好性能,該模型可以作為一個(gè)可信的和長(cháng)期的工具,在PD診斷中幫助臨床醫生。在未來(lái),作者提出用大量的研究對象來(lái)測試所開(kāi)發(fā)的模型,并旨在檢測PD的早期階段。