融合人工智能技術(shù) 搜索引擎工具即將發(fā)生巨變
來(lái)源:CNET科技資訊網(wǎng)
盡管大多數人都認為Google已經(jīng)設定了Web 搜索的標準,但一些技術(shù)專(zhuān)家認為,由于人工智能技術(shù)取得的進(jìn)展,很快會(huì )出現更好的搜索工具。
目前,搜索已經(jīng)成為許多人不可或缺的工具,考慮到Google在Web 文檔分析、超級計算、互聯(lián)網(wǎng)廣告方面取得的突破,我們會(huì )認為Google做的已經(jīng)相當好了。
但人工智能領(lǐng)域的一些人士稱(chēng),Google還沒(méi)有做到盡善盡美,它的技術(shù)只是未來(lái)技術(shù)的起點(diǎn)。
人工智能技術(shù)的支持者表示,終有一天,人們將能夠搜索小說(shuō)中的情節,或者列出過(guò)去5 年中說(shuō)過(guò)不利于環(huán)境保護的話(huà)的所有政治家名單,或在街上找到賣(mài)雨傘的地方。
自然語(yǔ)言處理、對象識別、機器學(xué)習等人工智能領(lǐng)域的技術(shù)將再次開(kāi)始“提高”Web 搜索的智能。
Medstory的創(chuàng )始人、首席執行官阿萊因說(shuō),這是Web 將以一種智能的方式為我們服務(wù)、為我們完成乏味任務(wù)的時(shí)代的開(kāi)始。Web 和信息量的增長(cháng)速度非???,開(kāi)發(fā)智能化的搜索系統是勢在必行的。
Medstory并不“孤獨”。Powerset、Riya等新興公司也在考慮將神秘的計算技術(shù)轉換為商業(yè)上的成功。
對于搜索引擎而言,Web 就是數以十億計網(wǎng)頁(yè)上大量的單詞和連接單詞的超級鏈接。Google獲得的一大突破是有效地連接這些單詞,根據單詞在網(wǎng)頁(yè)上出現的頻率、指向一個(gè)網(wǎng)頁(yè)的超級鏈接數量確定相關(guān)度。
但是,搜索引擎并不“理解”這些單詞,它們僅僅是對在網(wǎng)頁(yè)上更重要或被其它更多的網(wǎng)頁(yè)鏈接的關(guān)鍵字進(jìn)行匹配。
搜索引擎還無(wú)法理解人類(lèi)語(yǔ)言的細微差別。例如,如果用戶(hù)輸入“books by children ”,Google會(huì )搜索包括“books ”和“children”在內的網(wǎng)頁(yè),但不會(huì )考慮“by”,因為象“by”這樣的詞匯幾乎出現在所有網(wǎng)頁(yè)上。
這類(lèi)詞匯頻繁出現的原因在于它們對于一個(gè)短語(yǔ)的意義是非常重要的。“Books by children ”與“books about children”和“children\‘s books”都不相同。
一個(gè)尚未推出的人工智能搜索引擎的創(chuàng )始人巴尼將搜索引擎的這種限制稱(chēng)作“keywordese”。搜索引擎試圖將我們訓練成為一名好的關(guān)鍵字搜索者,使我們放棄了自己的智能。
他說(shuō),即將發(fā)生的一個(gè)變化是,不再把人類(lèi)的表達和交互轉化為計算機容易理解的方式,我們將使計算機的處理能力用于處理人類(lèi)容易理解的表達。
Powerset正在利用人工智能訓練計算機,不僅僅讀取網(wǎng)頁(yè)上的詞匯,而是使這些詞匯發(fā)生聯(lián)系、理解語(yǔ)言的意義。
為什么說(shuō)現在對人工智能和搜索引擎進(jìn)行試驗是正當其時(shí)?在搜索引擎中集成人工智能最大的障礙是,大規模這樣做是不可行的。批評人士稱(chēng),有效地產(chǎn)生這樣的結果所需要的計算能力是極其昂貴的。
但摩爾定律正在使計算機、處理器、帶寬的價(jià)格不斷下滑,因此試驗的機會(huì )正在成熟。搜索還是一種利潤豐厚的業(yè)務(wù),Google的年收入就達到了60億美元。
搜索領(lǐng)域的大多數人士都認為,Google等公司的Web 搜索技術(shù)正在“漸進(jìn)地”發(fā)展,但要有新的突破性進(jìn)展,必須要有新的架構出現。
本站僅提供存儲服務(wù),所有內容均由用戶(hù)發(fā)布,如發(fā)現有害或侵權內容,請
點(diǎn)擊舉報。