欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久

打開(kāi)APP
userphoto
未登錄

開(kāi)通VIP,暢享免費電子書(shū)等14項超值服

開(kāi)通VIP
圖像識別技術(shù)的現狀和未來(lái)
iCombinator
圖像識別技術(shù)的背景

移動(dòng)互聯(lián)網(wǎng)、智能手機以及社交網(wǎng)絡(luò )的發(fā)展帶來(lái)了海量圖片信息,根據BI五月份的文章,Instagram每天圖片上傳量約為6000萬(wàn)張;今年2月份WhatsApp每天的圖片發(fā)送量為5億張;國內的微信朋友圈也是以圖片分享為驅動(dòng)。不受地域和語(yǔ)言限制的圖片逐漸取代了繁瑣而微妙的文字,成為了傳詞達意的主要媒介。圖片成為互聯(lián)網(wǎng)信息交流主要媒介的原因主要在于兩點(diǎn):第一,從用戶(hù)讀取信息的習慣來(lái)看,相比于文字,圖片能夠為用戶(hù)提供更加生動(dòng)、容易理解、有趣及更具藝術(shù)感的信息;第二,從圖片來(lái)源來(lái)看,智能手機為我們帶來(lái)方便的拍攝和截屏手段,幫助我們更快的用圖片來(lái)采集和記錄信息。

但伴隨著(zhù)圖片成為互聯(lián)網(wǎng)中的主要信息載體,難題隨之出現。當信息由文字記載時(shí),我們可以通過(guò)關(guān)鍵詞搜索輕易找到所需內容并進(jìn)行任意編輯,而當信息是由圖片記載時(shí),我們卻無(wú)法對圖片中的內容進(jìn)行檢索,從而影響了我們從圖片中找到關(guān)鍵內容的效率。圖片給我們帶來(lái)了快捷的信息記錄和分享方式,卻降低了我們的信息檢索效率。在這個(gè)環(huán)境下,計算機的圖像識別技術(shù)就顯得尤為重要。

圖像識別是計算機對圖像進(jìn)行處理、分析和理解,以識別各種不同模式的目標和對像的技術(shù)。識別過(guò)程包括圖像預處理、圖像分割、特征提取和判斷匹配。簡(jiǎn)單來(lái)說(shuō),圖像識別就是計算機如何像人一樣讀懂圖片的內容。借助圖像識別技術(shù),我們不僅可以通過(guò)圖片搜索更快的獲取信息,還可以產(chǎn)生一種新的與外部世界交互的方式,甚至會(huì )讓外部世界更加智能的運行。百度李彥宏在2011年提到“全新的讀圖時(shí)代已經(jīng)來(lái)臨”,現在隨著(zhù)圖形識別技術(shù)的不斷進(jìn)步,越來(lái)越多的科技公司開(kāi)始涉及圖形識別領(lǐng)域,這標志著(zhù)讀圖時(shí)代正式到來(lái),并且將引領(lǐng)我們進(jìn)入更加智能的未來(lái)。

圖像識別的初級階段——娛樂(lè )化、工具化

在這個(gè)階段,用戶(hù)主要是借助圖像識別技術(shù)來(lái)滿(mǎn)足某些娛樂(lè )化需求。例如,百度魔圖的“大咖配”功能可以幫助用戶(hù)找到與其長(cháng)相最匹配的明星,百度的圖片搜索可以找到相似的圖片;Facebook研發(fā)了根據相片進(jìn)行人臉匹配的DeepFace;雅虎收購的圖像識別公司IQ Engine開(kāi)發(fā)的Glow可以通過(guò)圖像識別自動(dòng)生成照片的標簽以幫助用戶(hù)管理手機上的照片;國內專(zhuān)注于圖像識別的創(chuàng )業(yè)公司曠視科技成立了VisionHacker游戲工作室,借助圖形識別技術(shù)研發(fā)移動(dòng)端的體感游戲。

這個(gè)階段還有一個(gè)非常重要的細分領(lǐng)域——OCR(Optical Character Recognition,光學(xué)字符識別),是指光學(xué)設備檢查紙上打印的字符,通過(guò)檢測暗、亮的模式確定其形狀,然后用字符識別方法將形狀翻譯成計算機文字的過(guò)程,就是計算機對文字的閱讀。語(yǔ)言和文字是我們獲取信息最基本、最重要的途徑。在比特世界,我們可以借助互聯(lián)網(wǎng)和計算機輕松的獲取和處理文字。但一旦文字以圖片的形式表現出來(lái),就對我們獲取和處理文字平添了很多麻煩。這一方面表現為數字世界中由于特定原因被存儲稱(chēng)圖片格式的文字;另一方面是我們在現實(shí)生活中看到的所有物理形態(tài)的文字。所以我們需要借助OCR技術(shù)將這些文字和信息提取出來(lái)。在這方面,國內產(chǎn)品包括百度的涂書(shū)筆記和百度翻譯等;而谷歌借助經(jīng)過(guò)DistBelief 訓練的大型分布式神經(jīng)網(wǎng)絡(luò ),對于Google 街景圖庫的上千萬(wàn)門(mén)牌號的識別率超過(guò)90%,每天可識別百萬(wàn)門(mén)牌號。

在這個(gè)階段,圖像識別技術(shù)僅作為我們的輔助工具存在,為我們自身的人類(lèi)視覺(jué)提供了強有力的輔助和增強,帶給了我們一種全新的與外部世界進(jìn)行交互的方式。我們可以通過(guò)搜索找到圖片中的關(guān)鍵信息;可以隨手拍下一件陌生物體而迅速找到與之相關(guān)的各類(lèi)信息;可以將潛在搭訕對象拍下提前去她的社交網(wǎng)絡(luò )了解一番;也可以將人臉識別作為主要的身份認證方式……這些應用雖然看起來(lái)很普通,但當圖像識別技術(shù)滲透到我們行為習慣的方方面面時(shí),我們就相當于把一部分視力外包給了機器,就像我們已經(jīng)把部分記憶外包給了搜索引擎一樣。

這將極大改善我們與外部世界的交互方式,此前我們利用科技工具探尋外部世界的流程是這樣:人眼捕捉目標信息、大腦將信息進(jìn)行分析、轉化成機器可以理解的關(guān)鍵詞、與機器交互獲得結果。而當圖像識別技術(shù)賦予了機器“眼睛”之后,這個(gè)過(guò)程就可以簡(jiǎn)化為:人眼借助機器捕捉目標信息、機器和互聯(lián)網(wǎng)直接對信息進(jìn)行分析并返回結果。圖像識別使攝像頭成為解密信息的鑰匙,我們僅需把攝像頭對準某一未知事物,就能得到預想的答案。就像百度科學(xué)家余凱所說(shuō),攝像頭成為連接人和世界信息的重要入口之一。

圖像識別的高級階段——擁有視覺(jué)的機器

上文提到,目前的圖像識別技術(shù)是作為一個(gè)工具來(lái)幫助我們與外部世界進(jìn)行交互,只為我們自身的視覺(jué)提供了一個(gè)輔助作用,所有的行動(dòng)還需我們自己完成。而當機器真正具有了視覺(jué)之后,它們完全有可能代替我們去完成這些行動(dòng)。目前的圖像識別應用就像是盲人的導盲犬,在盲人行動(dòng)時(shí)為其指引方向;而未來(lái)的圖像識別技術(shù)將會(huì )同其他人工智能技術(shù)融合在一起成為盲人的全職管家,不需要盲人進(jìn)行任何行動(dòng),而是由這個(gè)管家幫助其完成所有事情。舉個(gè)例子,如果圖像識別是一個(gè)工具,就如同我們在駕駛汽車(chē)時(shí)佩戴谷歌眼鏡,它將外部信息進(jìn)行分析后傳遞給我們,我們再依據這些信息做出行駛決策;而如果將圖像識別利用在機器視覺(jué)和人工智能上,這就如同谷歌的無(wú)人駕駛汽車(chē),機器不僅可以對外部信息進(jìn)行獲取和分析,還全權負責所有的行駛活動(dòng),讓我們得到完全解放。

《人工智能:一種現代方法》中提到,在人工智能中,感知是通過(guò)解釋傳感器的響應而為機器提供它們所處的世界的信息,其中它們與人類(lèi)共有的感知形態(tài)包括視覺(jué)、聽(tīng)覺(jué)和觸覺(jué),而視覺(jué)最為重要,因為視覺(jué)是一切行動(dòng)的基礎。在一次論壇上百度IDL的余凱院長(cháng)問(wèn)大家,你覺(jué)得哪種感覺(jué)最重要?沒(méi)有人能很快作答,后來(lái)余凱院長(cháng)換了個(gè)提問(wèn)方式,如果要放棄一種感覺(jué),你最不愿意放棄的是那一種?這時(shí)大家都回答是視覺(jué)。Chris Frith在《心智的構建》中提到,我們對世界的感知不是直接的,而是依賴(lài)于“無(wú)意識推理”,也就是說(shuō)在我們能感知物體之前,大腦必須依據到達感官的信息來(lái)推斷這個(gè)物體可能是什么,這構成了人類(lèi)最重要的預判和處理突發(fā)時(shí)間的能力。而視覺(jué)是這個(gè)過(guò)程中最及時(shí)和準確的信息獲取渠道,人類(lèi)感覺(jué)信息中的80%都是視覺(jué)信息。機器視覺(jué)之于人工智能的意義就是視覺(jué)之于人類(lèi)的意義,而決定著(zhù)機器視覺(jué)的就是圖像識別技術(shù)。

更重要的是,在某些應用場(chǎng)景,機器視覺(jué)比人類(lèi)的生理視覺(jué)更具優(yōu)勢,它更加準確、客觀(guān)和穩定。人類(lèi)視覺(jué)有著(zhù)天然的局限,我們看起來(lái)能立刻且毫無(wú)費力的感知世界,而且似乎也能詳細生動(dòng)的感知整個(gè)視覺(jué)場(chǎng)景,但這只是一個(gè)錯覺(jué),只有投射到眼球中心的視覺(jué)場(chǎng)景的中間部分,我們才能詳細而色彩鮮明的看清楚。偏離中間大約10度的位置,神經(jīng)細胞更加分散并且智能探知光和陰影。也就是說(shuō),在我們視覺(jué)世界的邊緣是無(wú)色、模糊的。因此,我們才會(huì )存在“變化盲視”,才會(huì )在經(jīng)歷著(zhù)多樣事物發(fā)生時(shí),僅僅關(guān)注其中一樣,而忽視了其他樣事物的發(fā)生,而且不知道它們的發(fā)生。而機器在這方面就有著(zhù)更多的優(yōu)勢,它們能夠發(fā)現和記錄視力所及范圍內發(fā)生的所有事情。拿應用最廣的視頻監控來(lái)說(shuō),傳統監控需要有人在電視墻前時(shí)刻保持高度警惕,然后再通過(guò)自己對視頻的判斷來(lái)得出結論,但這往往會(huì )因為人的疲勞、視覺(jué)局限和注意力分散等原因影響監控效果。但有了成熟的圖像識別技術(shù)之后,再加以人工智能的支持,計算機就可以自行對視頻進(jìn)行分析和判斷,發(fā)現異常情況直接報警,帶來(lái)了更高的效率和準確度;在反恐領(lǐng)域,借助機器的人臉識別技術(shù)也要遠遠優(yōu)于人的主觀(guān)判斷。

許多科技巨頭也開(kāi)始了在圖像識別和人工智能領(lǐng)域的布局,Facebook簽下的人工智能專(zhuān)家Yann LeCun最重大的成就就是在圖像識別領(lǐng)域,其提出的LeNet為代表的卷積神經(jīng)網(wǎng)絡(luò ),在應用到各種不同的圖像識別任務(wù)時(shí)都取得了不錯效果,被認為是通用圖像識別系統的代表之一;Google 借助模擬神經(jīng)網(wǎng)絡(luò )“DistBelief”通過(guò)對數百萬(wàn)份 YouTube 視頻的學(xué)習自行掌握了貓的關(guān)鍵特征,這是機器在沒(méi)有人幫助的情況下自己讀懂了貓的概念。值得一提的是,負責這個(gè)項目的Andrew NG已經(jīng)轉投百度領(lǐng)導百度研究院,其一個(gè)重要的研究方向就是人工智能和圖像識別。這也能看出國內科技公司對圖像識別技術(shù)以及人工智能技術(shù)的重視程度。

圖像識別技術(shù),連接著(zhù)機器和這個(gè)一無(wú)所知的世界,幫助它越發(fā)了解這個(gè)世界,并最終代替我們完成更多的任務(wù)。

微信公眾號(關(guān)于人與科技的深度思考):機器之心,微信個(gè)人號:zhaoyunfeng1984

本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請點(diǎn)擊舉報。
打開(kāi)APP,閱讀全文并永久保存 查看更多類(lèi)似文章
猜你喜歡
類(lèi)似文章
中國超美、日成全球AI專(zhuān)利申請第一,自然語(yǔ)言處理受全球熱捧
下一幕:人工智能
AI不是魔法:人工智能的能與不能
在中文領(lǐng)域又有哪些重磅的AI科學(xué)家呢?
你以為AlphaGo下棋很難?百度大腦要去比的語(yǔ)音、圖像更難!
人工智能計算機視覺(jué)技術(shù)定義與應用
更多類(lèi)似文章 >>
生活服務(wù)
分享 收藏 導長(cháng)圖 關(guān)注 下載文章
綁定賬號成功
后續可登錄賬號暢享VIP特權!
如果VIP功能使用有故障,
可點(diǎn)擊這里聯(lián)系客服!

聯(lián)系客服

欧美性猛交XXXX免费看蜜桃,成人网18免费韩国,亚洲国产成人精品区综合,欧美日韩一区二区三区高清不卡,亚洲综合一区二区精品久久