GrowthNudge
你的成長(cháng),我來(lái)助推!
公眾號《成長(cháng)助推》致力于分享成長(cháng)需要的實(shí)用工具、技能、思維方式,以助推你的成長(cháng)為目標,直接省心的提供高效有價(jià)值的內容。
今日助推小目標:
1. 工具箱簡(jiǎn)單說(shuō)明。統計與機器學(xué)習工具箱;
2. 8046頁(yè)的PDF文檔下載。MathWorks的關(guān)于該工具箱的超詳細用戶(hù)手冊:Statistics and Machine Learning Toolbox User's Guide。
統計與機器學(xué)習工具箱
MathWorks公司有很多屬于機器學(xué)習分支的軟件包,提供用于數據分析的高質(zhì)量算法以及用于可視化圖形工具。這些軟件包可以相互集成或與其他Matlab函數集成,用以生成用于機器學(xué)習中的強大系統。
這些工具箱包括但不限于以下幾種:統計與機器學(xué)習工具箱;神經(jīng)網(wǎng)絡(luò )工具箱;計算機視覺(jué)系統工具箱;系統辨識工具箱等;
今天主要給大家簡(jiǎn)單介紹《統計與機器學(xué)習工具箱》,它提供用于從大量數據中獲取趨勢和模式的數據分析方法,包括分類(lèi)工具、回歸工具和聚類(lèi)工具等;
分類(lèi)方法用于將數據區分為不同的類(lèi)別。例如圖像形式的數據可用于按照是否有腫瘤對器官圖像分類(lèi)。分類(lèi)學(xué)習通常應用于手寫(xiě)識別,信用評分和面部識別等問(wèn)題中。分類(lèi)方法包括支持向量機(SVM),決策樹(shù)和神經(jīng)網(wǎng)絡(luò )等。
回歸方法允許基于當前數據構建模型預測未來(lái)的數據。在有新數據可用時(shí)可以持續更新回歸模型;數據只使用一次來(lái)創(chuàng )建模型,那么它處于批處理方法;在數據可用時(shí)合并新數據的回歸方法,屬于遞歸方法。
聚類(lèi)方法在數據中發(fā)現自然分組,目標識別是聚類(lèi)方法的一個(gè)應用。例如,如果想識別圖像中的汽車(chē),那么就去查找圖像中屬于汽車(chē)部分的關(guān)聯(lián)數據,雖然汽車(chē)具有不同的形狀和尺寸,但他們仍然有許多共同的特征。
工具箱具有許多功能來(lái)支持這些應用領(lǐng)域。
用戶(hù)手冊(User's Guide)
該手冊?xún)热葚S富,共8046頁(yè),2016年。
分類(lèi)算法可以將一個(gè)分類(lèi)應變量建模為一個(gè)或多個(gè)預測元的函數。工具箱提供了涵蓋多種參數化和非參數化分類(lèi)算法的應用程序和函數,如:
邏輯回歸;
促進(jìn)式和袋裝決策樹(shù);
樸素貝葉斯分類(lèi);
K-最近鄰(kNN)分類(lèi);
判別分析(線(xiàn)性和二次變量);
支持向量機(SVM);
回歸方法可將一個(gè)連續應變量建模為一個(gè)或多個(gè)預測元的函數。工具箱提供各種回歸算法,包括線(xiàn)性回歸、廣義線(xiàn)性模型、非線(xiàn)性回歸和混合效應模型。
線(xiàn)性回歸是一種用于描述作為一個(gè)或多個(gè)預測元變量的連續應變量的統計建模技術(shù)。它有助于您理解和預測復雜系統的行為,或者分析實(shí)驗、金融和生物數據。
非線(xiàn)性回歸是一種有助于描述實(shí)驗數據中非線(xiàn)性關(guān)系的統計建模技術(shù)。通常將非線(xiàn)性回歸模型假設為參數模型,將該模型稱(chēng)為非線(xiàn)性方程。工具箱還提供強大的非線(xiàn)性擬合,用于處理數據中的異常值。
工具箱提供包括用于執行聚類(lèi)分析的算法,通過(guò)根據相似度測量對數據分組來(lái)發(fā)現數據集中的規律??捎玫乃惴ò?k-均值、k-中心點(diǎn)、分層聚類(lèi)、高斯混合模型和隱馬爾可夫模型。當不知道聚類(lèi)的數量時(shí),可以使用聚類(lèi)評估技術(shù)根據特定指標確定數據中存在的聚類(lèi)數量。

進(jìn)入《成長(cháng)助推》公眾號,給后臺發(fā)送關(guān)鍵詞“機器學(xué)習”即可,自動(dòng)回復已備好。
聯(lián)系客服