中文輸入法這樣亟待改善但缺乏商機的“荒原”,如何成為一個(gè)創(chuàng )新主戰場(chǎng)
經(jīng)過(guò)幾個(gè)月前搜狐與谷歌那場(chǎng)聲勢浩大的“抄襲風(fēng)波”,現在你已經(jīng)可以重新估量輸入法對于一家網(wǎng)絡(luò )公司的價(jià)值:從4月8日搜狐公司發(fā)布聲明稱(chēng),谷歌拼音抄襲了搜狗輸入法詞庫,至今搜狐的股價(jià)已經(jīng)增長(cháng)了接近50%。而在此之前的1年時(shí)間里,搜狐的股價(jià)下跌了18%。雖然將階段性的股價(jià)變化歸結于某一種力量的結果是天真的,但一個(gè)較為準確的說(shuō)法是:通過(guò)一款幾兆大小的輸入法軟件,市值近12億美元的搜狐重新撬動(dòng)了華爾街對自己的熱情。
這是怎么開(kāi)始的?答案:這是一次為偷懶而創(chuàng )新的結果。
2005年,本科剛畢業(yè)、在太原一家國企做機械設計的馬占凱找到了一種省力的方法:寫(xiě)東西時(shí),如果輸入法不能直接打出所需詞語(yǔ),他不愿意去輸入法的詞表里一頁(yè)一頁(yè)尋找想敲的字,而是在搜索框里輸入相應的拼音(比如:zhoujielun),獲得搜索引擎相應的提示(“您要找的是不是:周杰倫”),由此復制粘貼。
這名沒(méi)有 任何計算機背景,但每天可能使用百余次搜索的年輕人,曾經(jīng)自己猜測出一套解釋?zhuān)核阉饕嬗幸粋€(gè)人工整理的巨大詞庫。但稍微刨根問(wèn)底之后,他發(fā)現,搜索引擎 充分利用了用戶(hù)輸入的關(guān)鍵詞,每當某個(gè)關(guān)鍵詞的搜索量達到一定的數目,比如幾百萬(wàn)次,那么這個(gè)關(guān)鍵詞就自動(dòng)被收入搜索引擎的詞庫。換言之,用搜索引擎來(lái)生 成一個(gè)常用詞的巨大詞庫,花費極小。
這讓馬占凱隱隱覺(jué)得,讓搜索引擎來(lái)做輸入法大有可為。
如果當時(shí)他認識任何輸入法業(yè)內人士,他的想法會(huì )被無(wú)情打擊:誰(shuí)還會(huì )在2005年進(jìn)入輸入法行業(yè)呢?早在1980、1990年代,微軟就相繼收購了智能ABC和微軟拼音,捆綁在Windows操作系統之中。此后還有一些來(lái)自民間程序師的作品,到2005年,這幾乎已經(jīng)成為一個(gè)寡頭壟斷的領(lǐng)域:智能ABC、紫光拼音、拼音加加和微軟拼音占據了輸入法市場(chǎng)的90%。
理論上,所有這些產(chǎn)品都具備充分的改進(jìn)空間。它們都是由人工整理詞庫,成本高且效果不好,很多詞不能及時(shí)被收入詞庫。占市場(chǎng)第一位的紫光拼音,甚至2003年到2006年初沒(méi)有推出一個(gè)升級版本。
但商業(yè)的力量阻止了改善的動(dòng)力。輸入法是一個(gè)叫好不叫座的產(chǎn)品。盡管中國的用戶(hù)不可避免使用到它,但是卻無(wú)法靠它取得收入。于是,輸入法領(lǐng)域的狀態(tài)是:不斷有人看到市場(chǎng)需求,不斷有人做出解決了某些問(wèn)題的新產(chǎn)品,卻沒(méi)有人能堅持長(cháng)期而頻繁的升級和維護過(guò)程。
從某種程度上說(shuō),馬占凱改變了這一切。如今,他已是搜狗輸入法的
產(chǎn)品經(jīng)理,他創(chuàng )意和設計的輸入法,為搜狐提供了一個(gè)接觸廣泛用戶(hù)的新通道:8月底第11版輸入法推出,新產(chǎn)品將和用戶(hù)賬戶(hù)綁定,通過(guò)同一賬戶(hù)可以在不同電腦上使用自己的個(gè)性化輸入法。于是,輸入法和博客一起,成為整個(gè)搜狐產(chǎn)品的入口,將為帶動(dòng)其新聞、社區等產(chǎn)品產(chǎn)生積極效用。
更重要的是,自QQ旋風(fēng)般占據四億網(wǎng)民的桌面開(kāi)始,客戶(hù)端軟件就展示了其巨大的想象空間。而輸入法是客戶(hù)端中粘性大、使用頻率高的軟件之一,比如,紫光拼音2005年的下載量就僅次于騰訊的QQ,約為2到3億。
雞肋
在中國科技業(yè)商業(yè)化程度不高時(shí),輸入法曾是創(chuàng )新最密集的領(lǐng)域——除了拼音、五筆,還有自然碼等數十種相關(guān)產(chǎn)品。
早在1980年代末,哈工大的一位博士生王曉龍就研發(fā)出了一款支持整句輸入的輸入法系統,后來(lái)為微軟所收購,成為微軟拼音。早期,輸入法領(lǐng)域還有“中文之星”所提供的新拼音輸入法,以及后來(lái)同樣被微軟收購的智能ABC?!爸形闹恰绷艚o很多人的記憶已經(jīng)淡薄,然而這款讓計算機識別中文的產(chǎn)品,其開(kāi)發(fā)者包括新浪奠基人王志東,以及后來(lái)的拼音加加的創(chuàng )始人廖恒毅。
在這些基礎之上,1996年,名噪一時(shí)的黑馬輸入法推出。其開(kāi)發(fā)者王勵在聯(lián)想漢卡待了三年多,在中文處理上積累了豐富經(jīng)驗。那時(shí),這個(gè)技術(shù)愛(ài)好者因為聯(lián)想要安排其去做管理職位而離開(kāi)聯(lián)想,加入黑馬飛騰科技有限公司,主導起校對技術(shù)的開(kāi)發(fā),并抽時(shí)間開(kāi)發(fā)出了“黑馬神拼”。
直到前不久搜狗和谷歌的爭端激烈之時(shí),中國最著(zhù)名的博客之一王小峰還在其博客上稱(chēng)贊使用多年的黑馬神拼質(zhì)量之高,引發(fā)了外界對黑馬的關(guān)注。
王勵把黑馬輸入法歸為是有別于五筆的字輸入、智能ABC及搜狗輸入法等的詞輸入的第三代輸入法,在整句輸入上準確率很高。黑馬拼音的句庫來(lái)自報紙、文學(xué)作品等成文的文字內容,并有自動(dòng)學(xué)習功能,既杜絕了錯詞的出現,又具有相當高的智能化水平。不過(guò),黑馬輸入法也有一個(gè)致命的弱點(diǎn):體積大,有400多兆,不利于傳播。
但在當時(shí)互聯(lián)網(wǎng)連接不暢情況下,這倒不成為問(wèn)題。依靠光盤(pán)銷(xiāo)售,黑馬神拼給黑馬公司帶來(lái)了意料之外的收入。直到今天,黑馬采取的仍然是這種銷(xiāo)售模式。
不過(guò),2001年,考慮到競爭對手是強大的微軟、輸入法又無(wú)法提供企業(yè)所需要的資金,王勵放棄在輸入法上的繼續更新,把精力集中到了黑馬的文字校對業(yè)務(wù),只留下黑馬神拼2001版和一些輸入法底層技術(shù)作為銷(xiāo)售和合作之用。
而因為找不到合適輸入法使用、干脆自己開(kāi)發(fā)了拼音加加的廖恒毅,也一度因為每月上百元的注冊費無(wú)法支撐,而停止了開(kāi)發(fā)和更新。
當然,這些人也并非沒(méi)有嘗試過(guò)尋找商業(yè)化途徑讓輸入法增值,不過(guò)僅僅停留在個(gè)人站長(cháng)式的經(jīng)營(yíng)方式上。比如,廖恒毅曾將拼音加加的首頁(yè)放置了一個(gè)百度的搜索框,進(jìn)而和百度合作分成。后來(lái),廖恒毅干脆把首頁(yè)設成了一個(gè)類(lèi)似hao123.com那樣的導航頁(yè)面,這樣一來(lái),他便能每月從中獲得 10萬(wàn)元左右的收入,這才結束了停止更新的日子。
“融資上市是一個(gè)機會(huì ),不過(guò)我只是一個(gè)資深技術(shù)人員,過(guò)程太復雜,無(wú)法把握?!蓖鮿畋硎?。
于是,這些輸入法的創(chuàng )始人們,幾乎都只把輸入法作為一個(gè)“副業(yè)”,自己卻不約而同的投入企業(yè)軟件這個(gè)“離錢(qián)更近”的領(lǐng)域。
這就使得2005年中,作為一個(gè)互聯(lián)網(wǎng)行業(yè)的門(mén)外漢,馬占凱有機會(huì )憑借一個(gè)資深互聯(lián)網(wǎng)用戶(hù)的體會(huì )、拿著(zhù)對輸入法產(chǎn)品的重新定義敲開(kāi)了搜狐的大門(mén):體積小,容易在互聯(lián)網(wǎng)上傳播;能敲打出熱門(mén)詞語(yǔ);有一個(gè)專(zhuān)門(mén)的團隊運作,更新快。
尋找伯樂(lè )
那時(shí)是馬占凱工作一周年,他終于忍受不了國有企業(yè)的沉悶與緩慢而辭職,懷揣著(zhù)從親友那里借來(lái)的錢(qián),只身來(lái)到北京,起初的目的是為了學(xué)些技能,再找工作。
在北京,撲面而來(lái)的,是互聯(lián)網(wǎng)的熾熱:一時(shí)間,李開(kāi)復離開(kāi)微軟來(lái)到谷歌中國、雅虎與阿里巴巴簽訂收購協(xié)議、百度即將上市前景看好。
這讓輸入法的創(chuàng )意在馬的腦海中重新升起。
百度上市前半個(gè)小時(shí),馬占凱趴在電腦前,按照網(wǎng)上的客服郵箱給百度寫(xiě)電子郵件,簡(jiǎn)要闡釋了輸入法的創(chuàng )意:把百度搜索默認的拼音提示都納入字庫中,再加上在線(xiàn)同步升級數據庫的功能,互聯(lián)網(wǎng)上的熱詞馬上就能出現在輸入法的詞庫中。
發(fā)出去之后,馬坐立不安地等待回復,在腦子里又搜索了一遍,生怕遺漏任何會(huì )引起別人的注意的建議。第二天中午,馬又補充了一封信,加上在輸入法中集成百度搜索和桌面搜索功能的提議。然而,幾天下來(lái),不斷刷新郵箱的他只收到百度的一封例行回復,無(wú)任何進(jìn)一步商談或合作意向。
馬不甘心,在又發(fā)去幾封郵件仍石沉大海之后,決定轉投搜狐。這一次,馬等來(lái)了迅速而且熱情洋溢的回復,搜狐的人表示對此很有興趣,約馬占凱三天之后到辦公室一談。
這三天的等待時(shí)間,馬占凱并沒(méi)有浪費。他全神貫注的待在電腦前,不斷使用搜索引擎、閱讀相關(guān)理論,想為來(lái)之不易的面試做足準備。于是,三天之后,在去搜狐前,他把這三天的成果事先發(fā)了過(guò)去——30 頁(yè)的文檔,其中包括上萬(wàn)字的搜索筆記、200個(gè)靈感點(diǎn)和100個(gè)小創(chuàng )意。
這種對搜索引擎的熟悉和產(chǎn)品思維為馬占凱順利贏(yíng)得了第二份工作,成為搜狐的
產(chǎn)品經(jīng)理。
馬決定繼續去游說(shuō)搜狐公司副總裁王建軍。為了使自己更具有說(shuō)服力,他統計了QQ和輸入法在各大下載網(wǎng)站上的下載量,并逐個(gè)分析了輸入法這個(gè)領(lǐng)域的競爭對手,把這些做成兩份 PPT。其顯示: QQ有約5億次下載,而輸入法的下載量是2到3億次。
第二次看完P(guān)PT之后,王明確:一定要做。
“輸入法效應”
事實(shí)上,輸入法的開(kāi)發(fā),與搜狐的戰略轉移有很大關(guān)系。
1998年,張朝陽(yáng)仿效雅虎的網(wǎng)頁(yè)目錄模式建立搜狐,進(jìn)入大而全的門(mén)戶(hù)運作。然而,2003年左右,這種內容主導的思路產(chǎn)生了動(dòng)搖。讓搜狐有切膚之痛的關(guān)鍵在于:在諸多重要產(chǎn)品上,如搜索、即時(shí)通訊等,搜狐都因為技術(shù)不如對手而落后甚遠。
不久之后,搜狐建立研發(fā)中心,主要是在搜索 領(lǐng)域加強技術(shù)研發(fā),即研制搜狗搜索引擎。一則從長(cháng)遠來(lái)看,搜索是互聯(lián)網(wǎng)發(fā)展的一個(gè)重要方向。二則搜索本身技術(shù)含量較高,研發(fā)出來(lái)的技術(shù)也可以輻射到搜狐的 其他產(chǎn)品領(lǐng)域。早期,研發(fā)中心甚為保密,并未和搜狐在同一辦公樓,也沒(méi)有門(mén)牌標識。由于與網(wǎng)易研發(fā)中心同處一樓,張朝陽(yáng)每次去時(shí)都要拉低帽沿,生怕被對方 員工認出。
即便采取此般暗渡陳倉之道,挑戰仍然顯而易見(jiàn):百度的技術(shù)已經(jīng)積累4年之久,搜狗能依靠什么突破口迎頭趕上?
正在搜狐高管們?yōu)檫@件事情頭疼的時(shí)候,輸入法的創(chuàng )意擺在了眼前?!拜斎敕ǖ拈_(kāi)發(fā),是搜狗的搜索技術(shù)發(fā)展過(guò)程中結出的一個(gè)果實(shí),同時(shí)也可以提高搜狗的品牌形象?!彼押夹g(shù)副總裁王小川告訴《環(huán)球企業(yè)家》。
王小川正是統籌輸入法開(kāi)發(fā)的技術(shù)小組的負責人。在收購紫光拼音不成的情況下,2005年10月,一個(gè)幾人組成的小組開(kāi)始進(jìn)行技術(shù)上的摸索,直到 2006年6月5日搜狗輸入法第一個(gè)版本發(fā)布,首階段工作持續了八個(gè)月。
事實(shí)上,因搜狗的搜索引擎的使用量不高,當時(shí)拼音提醒和糾錯功能都還沒(méi)有實(shí)現,因此在詞庫整理和篩選并不容易。
除了搜索關(guān)鍵詞之外,“詞庫運動(dòng)”還幾乎動(dòng)用了整個(gè)搜狐的資源。比如,開(kāi)發(fā)人員從go2map.com處要到地理信息名詞列表,從搜狐音樂(lè )搜索得到歌曲和歌手名稱(chēng)列表,從體育頻道獲得體育明星和賽事名詞列表??跨部門(mén)的合作耗費了諸多精力和時(shí)間。
另外,由于詞語(yǔ)來(lái)源于互聯(lián)網(wǎng),和黑馬神拼等相比,搜狗要解決的一個(gè)重要問(wèn)題是錯詞。搜狗每周會(huì )發(fā)布一份錯詞報告,糾正詞庫中的錯誤。
正因此,在第一版推出之后的十個(gè)月里,搜狗輸入法幾乎一個(gè)月就推出一個(gè)新版本,不斷的糾正詞庫錯誤,提高準確率,并添加一些吸引用戶(hù)的小功能,比如輸入法皮膚、自定義詞庫。
于是,這個(gè)新興的輸入法一經(jīng)推出,馬上獲得了預期的效果,迅速出現在無(wú)數人的桌面上,取代了原本紫光們的位置。
谷歌輸入法則更進(jìn)一步,其能跟網(wǎng)絡(luò )賬戶(hù)綁定。也就是說(shuō),無(wú)論你在任何電腦上,登錄你的個(gè)人賬戶(hù),便能使用你已熟練操作的詞庫。同時(shí),谷歌的“一鍵搜索”則讓搜狗員工嘆息品牌效應的威力。
馬占凱稱(chēng),自己最初的創(chuàng )意里也包括“一鍵搜索”,即在輸入法框上集成搜索。它被討論數次,一直擱置未實(shí)行的原因,在于搜狗為避免被誤認為“流氓軟件”的謹慎考慮,“這會(huì )影響用戶(hù)體驗,也不能帶來(lái)太多搜索量”,馬認為。
業(yè)內有人士稱(chēng),在技術(shù)領(lǐng)域,搜狗和谷歌輸入法的技術(shù)能力都不強,并不如黑馬和微軟。但搜狐和谷歌在易用性上的突破,讓它們暫時(shí)成功。
在一篇總結性質(zhì)的PPT中,馬占凱寫(xiě)道:在gmail之前大家以為email就是這樣了,在搜狗輸入法之前大家以為輸入法就是這樣了,中國互聯(lián)網(wǎng)領(lǐng)域很多都沒(méi)有開(kāi)始商業(yè)化運作,機會(huì )還很多。
對于輸入法而言,商業(yè)化運作剛剛開(kāi)始,成功也有多種可能性。
from:
http://www.gemag.com.cn/gemag/new/Article_Content.asp?D_ID=3527