|
||||
谷歌近日宣布即將在華推出手機語音搜索的消息引起各方關注。谷歌中國工程研究院副院長林斌,講述了如何從一封郵件開始,建立這一項目中國團隊的幕後故事,並表示新服務不會為用戶帶來使用成本方面的負擔。
14日中午11時,谷歌負責全球移動搜索的副總裁Vic Gundotra出現在谷歌中國總部,他此行的目的是向從兩岸三地匯集於此的媒體宣布,谷歌將於近期推出中文手機語音搜索服務,這也是谷歌手機語音搜索首次推出非英語版本。
在現場的中文手機語音搜索演示中,只要用戶對著手機說出想要搜索的內容,這一應用就能將用戶所發出的語音信息識別為文字,隨後自動進行搜索並迅速反饋回結果——無論你想要的是文字還是圖片。
甚至在某些看似『極端』的情況下,比方故意發出略帶口音的普通話、或說出一長串的內容,谷歌中文手機語音搜索都能良好完成自己的任務。
實際上,谷歌這項新技術的最核心的部分,已經不是如何搜索到最佳的結果。
如何准確識別出用戶發出的語音內容成為關鍵。而中文和英文之間的巨大差異,注定谷歌手機語音搜索推出中文版意味著眾多關鍵技術的重構。領導中國團隊進行這項工作的,正是谷歌中國工程研究院副院長林斌。
林斌最初接到這一任務的時候,谷歌手機語音搜索的英文版已初具雛形但尚未向外發布,林斌意識到要完成相應的中文版必須借助語音方面專業人員的力量。而就在谷歌中國總部的周圍,中科院和清華都有這方面的研究團隊。
不過林斌並沒有依靠外援,他的最終選擇是發送了一封內部郵件:谷歌中國所有懂語音技術的工程師,立即集合。林斌的信心來源於谷歌中國此前就有五六位語音技術的專家,而且時任谷歌中國總裁的李開復本身就是語音識別領域的權威。
林斌對新浪科技表示,中國團隊所要面臨的挑戰之一就是構建分詞算法。英語不存在分詞的問題,一個單詞就是一個單詞,而對於中文語音識別來說分詞則是重要基礎。
規則在此就變得尤為重要。語境分析是最好的判斷標准之一,林斌表示如果語境分析不足以判斷如何分詞,中文谷歌手機語音搜索將根據某一組詞出現的概率,由高到低進行選取。
另一個重要的工作是在全國范圍內采樣。雖然中文谷歌手機語音搜索主要支持的是普通話輸入,但考慮到更廣泛的用戶適用性,林斌的團隊還跑到中國各個地方去采集當地帶有方言腔調的普通話樣本。
於是,就算不標准的普通話輸入,中文谷歌搜索也能識別,即便是夾雜著英文的港臺腔,中文谷歌搜索也能識別。
不止一個人會想到這一技術,完全可以與谷歌眾多的產品相結合,比方谷歌辦公套件、谷歌輸入法、Gmail等等。
Vic Gundotra表示之所以率先用在手機上,是因為這個平臺的需求最迫切,此後將在電腦平臺上進行推廣,並表示將考慮將這一技術應用在更廣泛的輸入應用領域。林斌對此也表示不排除進一步融合相關產品,但谷歌中國要與谷歌總部步調一致。
談及這項谷歌耗費巨資的技術時,Vic Gundotra用『many many years(很多很多年)』來形容研發過程的漫長。而在這一基礎上,林斌和中國團隊僅用不到十個月的時間,就完成了中文版的全部工作,林斌說推出其他語言版本的時間將越來越快。
據介紹,中文版谷歌手機語音搜索采用雲計算的模式工作,采集到的語音樣本將送到雲端處理,轉化成文字內容。對於用戶而言,無疑會帶來手機數據傳輸流量的增加。
對於谷歌這一新技術的使用成本,林斌直言並不會給用戶帶來明顯的負擔。林斌對新浪科技表示,谷歌的工程師將語音采樣的數據包進行了深入的優化,這使得通過用戶手機發送的數據非常小。
林斌以自己為例說,目前他平均每天用手機語音搜索服務十次。據其推算按這一標准,購買5元包30M流量的資費套餐,足以應付谷歌中文手機語音搜索服務的要求。