機器學(xué)習(Machine Learning,ML)是一門(mén)多領(lǐng)域交叉學(xué)科,涉及概率論、統計學(xué)、逼近論、凸分析、算法復雜度理論等多門(mén)學(xué)科。其專(zhuān)門(mén)研究計算機是怎樣模擬或實(shí)現人類(lèi)的學(xué)習行為,以獲取新的知識或技能,重新組織已有的知識結構,使之不斷改善自身的性能。此外,數據挖掘和機器學(xué)習有很大的交集。本文將從架構和應用角度去解讀這兩個(gè)領(lǐng)域。
數據挖掘是從海量數據中獲取有效的、新穎的、潛在有用的、最終可理解的模式的非平凡過(guò)程。數據挖掘中用到了大量的機器學(xué)習界提供的數據分析技術(shù)和數據庫界提供的數據管理技術(shù)。從數據分析的角度來(lái)看,數據挖掘與機器學(xué)習有很多相似之處,但不同之處也十分明顯,例如,數據挖掘并沒(méi)有機器學(xué)習探索人的學(xué)習機制這一科學(xué)發(fā)現任務(wù),數據挖掘中的數據分析是針對海量數據進(jìn)行的,等等。從某種意義上說(shuō),機器學(xué)習的科學(xué)成分更重一些,而數據挖掘的技術(shù)成分更重一些。
學(xué)習能力是智能行為的一個(gè)非常重要的特征,不具有學(xué)習能力的系統很難稱(chēng)之為一個(gè)真正的智能系統,而機器學(xué)習則希望(計算機)系統能夠利用經(jīng)驗來(lái)改善自身的性能,因此該領(lǐng)域一直是人工智能的核心研究領(lǐng)域之一。在計算機系統中,“經(jīng)驗”通常是以數據的形式存在的,因此,機器學(xué)習不僅涉及對人的認知學(xué)習過(guò)程的探索,還涉及對數據的分析處理。實(shí)際上,機器學(xué)習已經(jīng)成為計算機數據分析技術(shù)的創(chuàng )新源頭之一。由于幾乎所有的學(xué)科都要面對數據分析任務(wù),因此機器學(xué)習已經(jīng)開(kāi)始影響到計算機科學(xué)的眾多領(lǐng)域,甚至影響到計算機科學(xué)之外的很多學(xué)科。機器學(xué)習是數據挖掘中的一種重要工具。然而數據挖掘不僅僅要研究、拓展、應用一些機器學(xué)習方法,還要通過(guò)許多非機器學(xué)習技術(shù)解決數據倉儲、大規模數據、數據噪聲等實(shí)踐問(wèn)題。機器學(xué)習的涉及面也很寬,常用在數據挖掘上的方法通常只是“從數據學(xué)習”。然而機器學(xué)習不僅僅可以用在數據挖掘上,一些機器學(xué)習的子領(lǐng)域甚至與數據挖掘關(guān)系不大,如增強學(xué)習與自動(dòng)控制等。所以筆者認為,數據挖掘是從目的而言的,機器學(xué)習是從方法而言的,兩個(gè)領(lǐng)域有相當大的交集,但不能等同。
圖1是一個(gè)典型的推薦類(lèi)應用,需要找到“符合條件的”潛在人員。要從用戶(hù)數據中得出這張列表,首先需要挖掘出客戶(hù)特征,然后選擇一個(gè)合適的模型來(lái)進(jìn)行預測,最后從用戶(hù)數據中得出結果。
圖1
把上述例子中的用戶(hù)列表獲取過(guò)程進(jìn)行細分,有如下幾個(gè)部分(見(jiàn)圖2)。
圖2
業(yè)務(wù)理解:理解業(yè)務(wù)本身,其本質(zhì)是什么?是分類(lèi)問(wèn)題還是回歸問(wèn)題?數據怎么獲???應用哪些模型才能解決?
數據理解:獲取數據之后,分析數據里面有什么內容、數據是否準確,為下一步的預處理做準備。
數據預處理:原始數據會(huì )有噪聲,格式化也不好,所以為了保證預測的準確性,需要進(jìn)行數據的預處理。
特征提?。禾卣魈崛∈菣C器學(xué)習最重要、最耗時(shí)的一個(gè)階段。
模型構建:使用適當的算法,獲取預期準確的值。
模型評估:根據測試集來(lái)評估模型的準確度。
模型應用:將模型部署、應用到實(shí)際生產(chǎn)環(huán)境中。
應用效果評估:根據最終的業(yè)務(wù),評估最終的應用效果。
整個(gè)過(guò)程會(huì )不斷反復,模型也會(huì )不斷調整,直至達到理想效果。
機器學(xué)習的算法有很多,這里從兩個(gè)方面進(jìn)行介紹:一個(gè)是學(xué)習方式,另一個(gè)是算法類(lèi)似性。
學(xué)習方式
根據數據類(lèi)型的不同,對一個(gè)問(wèn)題的建??梢杂胁煌姆绞?。在機器學(xué)習或人工智能領(lǐng)域,人們首先會(huì )考慮算法的學(xué)習方式。在機器學(xué)習領(lǐng)域有如下幾種主要的學(xué)習方式。
監督式學(xué)習:在監督式學(xué)習下,輸入數據被稱(chēng)為“訓練數據”,每組訓練數據都有一個(gè)明確的標識或結果,如對防垃圾郵件系統中的“垃圾郵件”、“非垃圾郵件”,對手寫(xiě)數字識別中的“1”、“2”、“3”、“4”等。在建立預測模型的時(shí)候,監督式學(xué)習建立一個(gè)學(xué)習過(guò)程,將預測結果與“訓練數據”的實(shí)際結果進(jìn)行比較,不斷地調整預測模型,直到模型的預測結果達到一個(gè)預期的準確率。監督式學(xué)習的常見(jiàn)應用場(chǎng)景包括分類(lèi)問(wèn)題和回歸問(wèn)題。常見(jiàn)算法有邏輯回歸和反向傳遞神經(jīng)網(wǎng)絡(luò )。
非監督式學(xué)習:在非監督式學(xué)習下,數據并不被特別標識,學(xué)習模型是為了推斷出數據的一些內在結構。常見(jiàn)的應用場(chǎng)景包括關(guān)聯(lián)規則的學(xué)習及聚類(lèi)等。常見(jiàn)算法包括Apriori算法和K-Means算法。
半監督式學(xué)習:在半監督式學(xué)習下,輸入數據部分被標識,部分沒(méi)有被標識。這種學(xué)習模型可以用來(lái)進(jìn)行預測,但是模型首先需要學(xué)習數據的內在結構,以便合理地組織數據進(jìn)行預測。其應用場(chǎng)景包括分類(lèi)和回歸。常見(jiàn)算法包括一些對常用監督式學(xué)習算法的延伸。這些算法首先試圖對未標識的數據進(jìn)行建模,然后在此基礎上對標識的數據進(jìn)行預測,如圖論推理算法或拉普拉斯支持向量機等。
強化學(xué)習:在強化學(xué)習下,輸入數據作為對模型的反饋,不像監督模型那樣,輸入數據僅僅作為一種檢查模型對錯的方式。在強化學(xué)習下,輸入數據直接反饋到模型,模型必須對此立刻做出調整。常見(jiàn)的應用場(chǎng)景包括動(dòng)態(tài)系統及機器人控制等。常見(jiàn)算法包括Q-Learning及時(shí)間差學(xué)習(Temporal Difference Learning)等。
在企業(yè)數據應用的場(chǎng)景下,人們最常用的可能就是監督式學(xué)習和非監督式學(xué)習。在圖像識別等領(lǐng)域,由于存在大量的非標識數據和少量的可標識數據,目前半監督式學(xué)習是一個(gè)很熱門(mén)的話(huà)題。而強化學(xué)習更多地應用在機器人控制及其他需要進(jìn)行系統控制的領(lǐng)域。
算法類(lèi)似性
根據算法的功能和形式的類(lèi)似性,可以對算法進(jìn)行分類(lèi),如基于樹(shù)的算法、基于神經(jīng)網(wǎng)絡(luò )的算法等。當然,機器學(xué)習的范圍非常龐大,有些算法很難明確歸到某一類(lèi)。而對于有些分類(lèi)來(lái)說(shuō),同一分類(lèi)的算法可以針對不同類(lèi)型的問(wèn)題。這里,我們盡量把常用的算法按照最容易理解的方式進(jìn)行分類(lèi)。
回歸算法:回歸算法是試圖采用對誤差的衡量來(lái)探索變量之間的關(guān)系的一類(lèi)算法?;貧w算法是統計機器學(xué)習的利器。常見(jiàn)的回歸算法包括最小二乘法、邏輯回歸、逐步式回歸、多元自適應回歸樣條及本地散點(diǎn)平滑估計等。
基于實(shí)例的算法:基于實(shí)例的算法常常用來(lái)對決策問(wèn)題建立模型,這樣的模型常常先選取一批樣本數據,然后根據某些近似性把新數據與樣本數據進(jìn)行比較,從而找到最佳的匹配。因此,基于實(shí)例的算法常常被稱(chēng)為“贏(yíng)家通吃學(xué)習”或者“基于記憶的學(xué)習”。常見(jiàn)的算法包括k-Nearest Neighbor(kNN)、學(xué)習矢量量化(Learning Vector Quantization,LVQ)及自組織映射算法(Self-Organizing Map,SOM)等。
正則化算法:正則化算法是其他算法(通常是回歸算法)的延伸,根據算法的復雜度對算法進(jìn)行調整。正則化算法通常對簡(jiǎn)單模型予以獎勵,而對復雜算法予以懲罰。常見(jiàn)的算法包括Ridge Regression、Least Absolute Shrinkage and Selection Operator(LASSO)及彈性網(wǎng)絡(luò )(Elastic Net)等。
決策樹(shù)算法:決策樹(shù)算法根據數據的屬性采用樹(shù)狀結構建立決策模型,常用來(lái)解決分類(lèi)和回歸問(wèn)題。常見(jiàn)算法包括分類(lèi)及回歸樹(shù)(Classification and Regression Tree,CART)、ID3(Iterative Dichotomiser 3)、C4.5、Chi-squared Automatic Interaction Detection(CHAID)、Decision Stump、隨機森林(Random Forest)、多元自適應回歸樣條(MARS)及梯度推進(jìn)機(GBM)等。
貝葉斯算法:貝葉斯算法是基于貝葉斯定理的一類(lèi)算法,主要用來(lái)解決分類(lèi)和回歸問(wèn)題。常見(jiàn)的算法包括樸素貝葉斯算法、平均單依賴(lài)估計(Averaged One-Dependence Estimators,AODE)及Bayesian Belief Network(BBN)等。
基于核的算法:基于核的算法中最著(zhù)名的莫過(guò)于支持向量機(SVM)?;诤说乃惴ㄊ前演斎霐祿成涞揭粋€(gè)高階的向量空間,在這些高階向量空間里,有些分類(lèi)或者回歸問(wèn)題能夠更容易地解決。常見(jiàn)的基于核的算法包括支持向量機(Support Vector Machine,SVM)、徑向基函數(Radial Basis Function,RBF)及線(xiàn)性判別分析(Linear Discriminate Analysis,LDA)等。
聚類(lèi)算法:聚類(lèi)算法通常按照中心點(diǎn)或者分層的方式對輸入數據進(jìn)行歸并。所有的聚類(lèi)算法都試圖找到數據的內在結構,以便按照最大的共同點(diǎn)將數據進(jìn)行歸類(lèi)。常見(jiàn)的聚類(lèi)算法包括K-Means算法及期望最大化算法(EM)等。
關(guān)聯(lián)規則學(xué)習:關(guān)聯(lián)規則學(xué)習通過(guò)尋找最能夠解釋數據變量之間關(guān)系的規則,來(lái)找出大量多元數據集中有用的關(guān)聯(lián)規則。常見(jiàn)的算法包括Apriori算法和Eclat算法等。
人工神經(jīng)網(wǎng)絡(luò )算法:人工神經(jīng)網(wǎng)絡(luò )算法模擬生物神經(jīng)網(wǎng)絡(luò ),是一類(lèi)模式匹配算法,通常用于解決分類(lèi)和回歸問(wèn)題。人工神經(jīng)網(wǎng)絡(luò )是機器學(xué)習的一個(gè)龐大的分支,有幾百種不同的算法(深度學(xué)習就是其中的一類(lèi)算法)。常見(jiàn)的人工神經(jīng)網(wǎng)絡(luò )算法包括感知器神經(jīng)網(wǎng)絡(luò )、反向傳遞、Hopfield網(wǎng)絡(luò )、自組織映射及學(xué)習矢量量化等。
深度學(xué)習算法:深度學(xué)習算法是對人工神經(jīng)網(wǎng)絡(luò )的發(fā)展。在計算能力變得日益廉價(jià)的今天,深度學(xué)習算法試圖建立大得多也復雜得多的神經(jīng)網(wǎng)絡(luò )。很多深度學(xué)習算法是半監督式學(xué)習算法,用來(lái)處理存在少量未標識數據的大數據集。常見(jiàn)的深度學(xué)習算法包括受限波爾茲曼機(RBN)、Deep Belief Networks(DBN)、卷積網(wǎng)絡(luò )(Convolutional Network)及堆棧式自動(dòng)編碼器 (Stacked Auto-encoders)等。
降低維度算法:與聚類(lèi)算法一樣,降低維度算法試圖分析數據的內在結構,不過(guò)降低維度算法通過(guò)非監督式學(xué)習,試圖利用較少的信息來(lái)歸納或者解釋數據。這類(lèi)算法可以用于高維數據的可視化,或者用來(lái)簡(jiǎn)化數據以便監督式學(xué)習使用。常見(jiàn)的降低維度算法包括主成分分析(Principle Component Analysis,PCA)、偏最小二乘回歸(Partial Least Square Regression,PLSR)、Sammon映射、多維尺度(Multi-Dimensional Scaling,MDS)及投影追蹤(Projection Pursuit)等。
集成算法:集成算法用一些相對較弱的學(xué)習模型獨立地就同樣的樣本進(jìn)行訓練,然后把結果整合起來(lái)進(jìn)行整體預測。集成算法的主要難點(diǎn)在于究竟集成哪些獨立的、較弱的學(xué)習模型,以及如何把學(xué)習結果整合起來(lái)。這是一類(lèi)非常強大的算法,同時(shí)也非常流行。常見(jiàn)的集成算法包括Boosting、Bootstrapped Aggregation(Bagging)、AdaBoost、堆疊泛化(Stacked Generalization,Blending)、梯度推進(jìn)機(Gradient Boosting Machine,GBM)及隨機森林(Random Forest)等。
前面了解了機器學(xué)習和數據挖掘的基本概念,下面來(lái)看一下業(yè)界成熟的案例,對機器學(xué)習和數據挖掘有一個(gè)直觀(guān)的理解。
尿布和啤酒的故事
先來(lái)看一則有關(guān)數據挖掘的故事——“尿布與啤酒”。
總部位于美國阿肯色州的世界著(zhù)名商業(yè)零售連鎖企業(yè)沃爾瑪擁有世界上最大的數據倉庫系統。為了能夠準確了解顧客在其門(mén)店的購買(mǎi)習慣,沃爾瑪對其顧客的購物行為進(jìn)行購物籃分析,想知道顧客經(jīng)常一起購買(mǎi)的商品有哪些。沃爾瑪數據倉庫里集中了其各門(mén)店的詳細原始交易數據,在這些原始交易數據的基礎上,沃爾瑪利用NCR數據挖掘工具對這些數據進(jìn)行分析和挖掘。一個(gè)意外的發(fā)現是:跟尿布一起購買(mǎi)最多的商品竟然是啤酒!這是數據挖掘技術(shù)對歷史數據進(jìn)行分析的結果,反映了數據的內在規律。那么,這個(gè)結果符合現實(shí)情況嗎?是否有利用價(jià)值?
于是,沃爾瑪派出市場(chǎng)調查人員和分析師對這一數據挖掘結果進(jìn)行調查分析,從而揭示出隱藏在“尿布與啤酒”背后的美國人的一種行為模式:在美國,一些年輕的父親下班后經(jīng)常要到超市去買(mǎi)嬰兒尿布,而他們中有30%~40%的人同時(shí)也為自己買(mǎi)一些啤酒。產(chǎn)生這一現象的原因是:美國的太太們常叮囑她們的丈夫下班后為小孩買(mǎi)尿布,而丈夫們在買(mǎi)完尿布后又隨手帶回了他們喜歡的啤酒。
既然尿布與啤酒一起被購買(mǎi)的機會(huì )很多,于是沃爾瑪就在其各家門(mén)店將尿布與啤酒擺放在一起,結果是尿布與啤酒的銷(xiāo)售量雙雙增長(cháng)。
決策樹(shù)用于電信領(lǐng)域故障快速定位
電信領(lǐng)域比較常見(jiàn)的應用場(chǎng)景是決策樹(shù),利用決策樹(shù)來(lái)進(jìn)行故障定位。比如,用戶(hù)投訴上網(wǎng)慢,其中就有很多種原因,有可能是網(wǎng)絡(luò )的問(wèn)題,也有可能是用戶(hù)手機的問(wèn)題,還有可能是用戶(hù)自身感受的問(wèn)題。怎樣快速分析和定位出問(wèn)題,給用戶(hù)一個(gè)滿(mǎn)意的答復?這就需要用到?jīng)Q策樹(shù)。
圖3就是一個(gè)典型的用戶(hù)投訴上網(wǎng)慢的決策樹(shù)的樣例。
圖3
圖像識別領(lǐng)域
小米面孔相冊
這項功能的名字叫“面孔相冊”,可以利用圖像分析技術(shù),自動(dòng)地對云相冊照片內容按照面孔進(jìn)行分類(lèi)整理。開(kāi)啟“面孔相冊”功能后,可以自動(dòng)識別、整理和分類(lèi)云相冊中的不同面孔。
“面孔相冊”還支持手動(dòng)調整分組、移出錯誤面孔、通過(guò)系統推薦確認面孔等功能,從而彌補機器識別的不足。
這項功能的背后其實(shí)使用的是深度學(xué)習技術(shù),自動(dòng)識別圖片中的人臉,然后進(jìn)行自動(dòng)識別和分類(lèi)。
支付寶掃臉支付
馬云在2015 CeBIT展會(huì )開(kāi)幕式上首次展示了螞蟻金服的最新支付技術(shù)“Smile to Pay”(掃臉支付),驚艷全場(chǎng)。支付寶宣稱(chēng),Face++ Financial人臉識別技術(shù)在LFW國際公開(kāi)測試集中達到99.5%的準確率,同時(shí)還能運用“交互式指令+連續性判定+3D判定”技術(shù)。人臉識別技術(shù)基于神經(jīng)網(wǎng)絡(luò ),讓計算機學(xué)習人的大腦,并通過(guò)“深度學(xué)習算法”大量訓練,讓它變得極為“聰明”,能夠“認人”。實(shí)現人臉識別不需要用戶(hù)自行提交照片,有資質(zhì)的機構在需要進(jìn)行人臉識別時(shí),可以向全國公民身份證號碼查詢(xún)服務(wù)中心提出申請,將采集到的照片與該部門(mén)的權威照片庫進(jìn)行比對。
也就是說(shuō),用戶(hù)在進(jìn)行人臉識別時(shí),只需打開(kāi)手機或電腦的攝像頭,對著(zhù)自己的正臉進(jìn)行拍攝即可。在智能手機全面普及的今天,這個(gè)參與門(mén)檻低到可以忽略不計。
用戶(hù)容易擔心的隱私問(wèn)題在人臉識別領(lǐng)域也能有效避免,因為照片來(lái)源權威,同時(shí),一種特有的“脫敏”技術(shù)可以將照片模糊處理成肉眼無(wú)法識別而只有計算機才能識別的圖像。
圖片內容識別
前面兩個(gè)案例介紹的都是圖片識別,比圖片識別更難的是圖片語(yǔ)義的理解和提取,百度和Google都在進(jìn)行這方面的研究。
百度的百度識圖能夠有效地處理特定物體的檢測識別(如人臉、文字或商品)、通用圖像的分類(lèi)標注,如圖4所示。
圖4
來(lái)自Google研究院的科學(xué)家發(fā)表了一篇博文,展示了Google在圖形識別領(lǐng)域的最新研究進(jìn)展?;蛟S未來(lái)Google的圖形識別引擎不僅能夠識別出圖片中的對象,還能夠對整個(gè)場(chǎng)景進(jìn)行簡(jiǎn)短而準確的描述,如圖5所示。這種突破性的概念來(lái)自機器語(yǔ)言翻譯方面的研究成果:通過(guò)一種遞歸神經(jīng)網(wǎng)絡(luò )(RNN)將一種語(yǔ)言的語(yǔ)句轉換成向量表達,并采用第二種RNN將向量表達轉換成目標語(yǔ)言的語(yǔ)句。
圖5
而Google將以上過(guò)程中的第一種RNN用深度卷積神經(jīng)網(wǎng)絡(luò )CNN替代,這種網(wǎng)絡(luò )可以用來(lái)識別圖像中的物體。通過(guò)這種方法可以實(shí)現將圖像中的對象轉換成語(yǔ)句,對圖像場(chǎng)景進(jìn)行描述。概念雖然簡(jiǎn)單,但實(shí)現起來(lái)十分復雜,科學(xué)家表示目前實(shí)驗產(chǎn)生的語(yǔ)句合理性不錯,但距離完美仍有差距,這項研究目前僅處于早期階段。圖6展示了通過(guò)此方法識別圖像對象并產(chǎn)生描述的過(guò)程。

圖6
自然語(yǔ)言識別
自然語(yǔ)言識別一直是一個(gè)非常熱門(mén)的領(lǐng)域,最有名的是蘋(píng)果的Siri,支持資源輸入,調用手機自帶的天氣預報、日常安排、搜索資料等應用,還能夠不斷學(xué)習新的聲音和語(yǔ)調,提供對話(huà)式的應答。微軟的Skype Translator可以實(shí)現中英文之間的實(shí)時(shí)語(yǔ)音翻譯功能,將使得英文和中文普通話(huà)之間的實(shí)時(shí)語(yǔ)音對話(huà)成為現實(shí)。
Skype Translator的運作機制如圖7所示。
圖7
在準備好的數據被錄入機器學(xué)習系統后,機器學(xué)習軟件會(huì )在這些對話(huà)和環(huán)境涉及的單詞中搭建一個(gè)統計模型。當用戶(hù)說(shuō)話(huà)時(shí),軟件會(huì )在該統計模型中尋找相似的內容,然后應用到預先“學(xué)到”的轉換程序中,將音頻轉換為文本,再將文本轉換成另一種語(yǔ)言。
雖然語(yǔ)音識別一直是近幾十年來(lái)的重要研究課題,但是該技術(shù)的發(fā)展普遍受到錯誤率高、麥克風(fēng)敏感度差異、噪聲環(huán)境等因素的阻礙。將深層神經(jīng)網(wǎng)絡(luò )(DNNs)技術(shù)引入語(yǔ)音識別,極大地降低了錯誤率、提高了可靠性,最終使這項語(yǔ)音翻譯技術(shù)得以廣泛應用。
Artificial Intelligence(人工智能)是人類(lèi)美好的愿望之一。雖然計算機技術(shù)已經(jīng)取得了長(cháng)足的進(jìn)步,但截至目前,還沒(méi)有一臺計算機能夠產(chǎn)生“自我”的意識。的確,在人類(lèi)和大量現有數據的幫助下,計算機可以表現得十分強大,但是離開(kāi)了這兩者,它甚至都不能分辨兩只小動(dòng)物。
深度學(xué)習算法自動(dòng)提取分類(lèi)所需的低層次或者高層次特征。高層次特征是指該特征可以分級(層次)地依賴(lài)其他特征。例如,對于機器視覺(jué),深度學(xué)習算法從原始圖像去學(xué)習得到它的一個(gè)低層次表達,如邊緣檢測器、小波濾波器等,然后在這些低層次表達的基礎上再建立表達,如這些低層次表達的線(xiàn)性或者非線(xiàn)性組合,然后重復這個(gè)過(guò)程,最后得到一個(gè)高層次的表達。
深度學(xué)習能夠得到更好地表示數據的特征,同時(shí)由于模型的層次、參數很多,容量足夠,因此,模型有能力表示大規模數據。所以對于圖像、語(yǔ)音這種特征不明顯(需要手工設計且很多沒(méi)有直觀(guān)的物理含義)的問(wèn)題,能夠在大規模訓練數據上取得更好的效果。此外,從模式識別特征和分類(lèi)器的角度來(lái)看,深度學(xué)習框架將特征和分類(lèi)器結合到一個(gè)框架中,用數據去學(xué)習特征,在使用中減少了手工設計特征的巨大工作量,因此,不僅效果更好,而且使用起來(lái)也有很多方便之處。
當然,深度學(xué)習本身并不是完美的,也不是解決任何機器學(xué)習問(wèn)題的利器,不應該被放大到一個(gè)無(wú)所不能的程度。
本文主要介紹了機器學(xué)習、數據挖掘以及當前最熱門(mén)的深度學(xué)習。深度學(xué)習可以說(shuō)掀起了人工智能的又一次熱潮,但是大家要清楚地認識到,這離真正的AI(人工智能)還差得很遠。但總的來(lái)說(shuō),我們離電影中描述的未來(lái)世界更近了一步,不是嗎?

聯(lián)系客服