首頁 > 產業快訊

產業快訊 News

更新日期:2012-04-10

Google:讓Google Search越搜越「聰明」


 近期的消息中,Google準備重新調整Google Search可準確判斷使用者輸入文字語意,進而提供更為精準的搜尋結果,甚至透過簡單的判斷後直接顯示「答案」。台灣Google在稍早邀請近期晉升為搜尋部門資深副總的Amit Singhai,跟現場媒體分享現行針對搜尋的發展方向。

 

現任為Google院士,同時也在近期晉升為搜尋部門資深副總的Amit Singhai,本身在Google主要負責搜尋應用方面的發展,例入在不同地區使用不同或相同語言背景的文字輸入時,會顯示因地而異的查找結果,甚至配合登入個人帳戶則會進一步顯示更貼近個人使用需求的內容,此外先前Google在網頁或Mobile平台所加入的Instant Pages功能,或語音輸入搜尋與圖片搜尋也都是出自於Amit Singhai旗下的創意。

 

從文字比對到語意瞭解

 

在今天稍早所舉辦的視訊訪談中,Amit Singhai就現行Google的發展做簡單說明,其中表示在2000年之前的搜尋,其實主要僅就單純的文字比對做結果排序,但在其後資料隨著科技成長而有爆炸性突破後,搜尋累積資料量也越來越多,其中可能夾雜過多不必要的內容,在Google逐步提昇各式技術之後也才慢慢地將所謂的資料「整理」為有用資訊 (編按:當然,目前還不算是盡善盡美)。

 

在目前Google所努力的目標,主要是想辦法將這些資訊往可直接變成有用知識的方向做發展,進一步讓使用者可更直覺地透過關鍵字,甚至是自然語意直接找到所需要的「答案」。

就現行來看,Google Search可以透過眾人輸入搜尋、內容點擊、所在位置等習慣及各類參考訊息,藉由內部獨特演算法動態調整各類訊息的「準確性」,例如目前使用者可以直接在Google搜尋框內輸入包含股票、天氣、電影或賽事時刻,甚至是簡單的單位換算或數字運算都可以有即時的「答案」出現,而近期也陸續加入包含飛機航班時刻等資訊。

 

而在蒐集越來越多的內容資料後,Google便會透過背後系統不同圖表數據比對進行演算,讓隱藏在Google Search背後龐大的運算系統「瞭解」使用者所輸入關鍵字詞的實際代表意義。

 

現階段所碰上的困難點…

 

而要讓Google Search變得更加「聰明」,除了要透過使用者大量累積使用結果整理,同時也必須在後端建立更加完整的資料關聯,畢竟對電腦系統而言,輸入的「文字」僅只是由數字與文字符號 (或說是0與1程式編碼而成的內容),但要如何讓Google Search可以完整認知並實現理想的「聰明搜尋」目標,看起來還有一段相當長的發展路程要走。例如在中文等東方語系在語意、字句結構或新創名詞等便與西方語系有著明顯不同邏輯,再加上用語習慣、發音等差異,也著實在關鍵字輸入或近期推行的語音搜尋、語意搜尋有資料搜尋判斷的影響。

 

根據Amit Singhai的說法,目前確實在不同語系上的轉換、判斷有相當的困難度存在,因此目前多數的搜尋應用主要還是以西方語系為首要發展,但相關團隊目前已經針對包含各地漢語、日語或韓語等內容搜尋轉譯、理解做強化,而估計這方面的發展也將能使Google翻譯效能有所增長?

 

而除了基本的關鍵字、語意等內容能進一步讓搜尋系統「理解」,進而順利查找出「正確」的答案之外,Google Search另外一項要求便是要夠快,這方面便會進一步牽涉到位於系統背後的複雜演算方式,不過在今天的訪談中主要聚焦於發展方向,因此在技術應用方面的細節並未多談,不過Amit Singhai在現場則是透過一張可視化圖表內容呈現目前Google Search背後的概略運算邏輯。

 

讓搜尋變得更好

 

至於針對Google Search的調整是否將影響廣告主端的經濟市場體系,根據Amit Singhai的說明表示目前並不至於會有這方面的問題,或許部份藉由Google搜尋最佳化技術打造的廣告內容網站會在網頁排序受影響,但以整體來看主要是可讓使用者獲得最加的內容搜尋結果,同時也更便利於透過關鍵字或語意內容尋找「答案」。

 

而針對近期隱私問題的部份,Amit Singhai也表示確實在登入個人Google帳戶後可讓搜尋結果更為準確 (按照個人填入資料、使用習慣等資訊加入關鍵字查找時的判斷),不過Google Search並未強制要求使用者必須登入帳戶後才能使用,同時目前Google也盡量透過旗下技術在未登入個人帳戶情況下也能達成相當準確的內容搜尋品質,因此在隱私問題部份其實並不算有太大的影響,若使用者需要作更為精準的搜尋時可能就需要配合登入Google帳戶,此時才會涉及到個資內容存取的問題,但Google官方並不會任意對外公開或兜售這些內容。

 

另外,對於語音搜尋、語意搜尋等技術陸續加入Google Search中是否會讓使用者在日後搜尋行為產生改變,Amit Singhai的看法認為許多的使用行為影響都是漸進式的改變,一如Google在搜尋技術的突破也並非是一下子就有顯著的可視化成果,使用者的搜尋習慣也或許會在發展潛移默化中產生不同使用模式。

 

更新:以下為近期Google官方所公佈的一些數據內容:


規模

.每日搜尋量:Google每日有數十億的搜尋量

.新的搜尋量:自2003年開始,Google已為4500億個搜尋提供結果,其中每天均有16%都是新的搜尋

.使用者在Google的每個搜尋要求到得到結果的過程,平均需經過1500英哩

.實驗:Google在任何時間都在進行200個以上的即時實驗。在2011年進行的實驗包含:

- 41831個精確估算

- 9250個對比實驗

- 7362個即時流量實驗或「點擊計算」


品質

.創新速度:在2010年到2011年,Google分別針對搜尋品質進行超過500項和520項改良

.歷史:Google在搜尋演算法的開發已投入相當於1000多人力工作年 (1000 man-years)的時間

.索引:搜尋引擎公司使用不同的測量方式,因此Google不詳細描述索引規模大小。Google將數十億的網頁編入索引,例如「咖啡因」的索引就多達一億gigabytes

.網頁級數、元素 (PageRank、Signals):網頁級數是200多種定義網頁等級元素中的其中一種

.速度:Google平均的搜尋回覆速度大約為0.25秒,而眨眼的平均速度是0.1秒

.更新速度:Google剛推出時,大約一個月推出一個新的索引;現在,Google通常在新網站或部落格的內容一推出後的數秒或數分鐘內,便把熱門的內容編入索引。對於本質比較靜態、無變動的內容,Google仍每隔幾天就大量更新

 

全球/行動

.全球流量:Google的搜尋量有一半以上來自美國以外的地區

.語言:搜尋功能支援146種介面語言 (包括五種「假」語言,例如Elmer Fudd和Swedish Chef)。而全球有數千萬使用者使用Google翻譯;在過去三年,Google翻譯的使用量增加10倍以上

.網域:Google搜尋可在181個國際網域使用

.翻譯:Google提供64種語言翻譯和4,032種語言搭配的免費服務,並且每天處理數億計的翻譯量

 

 

來源: udn數位資訊 

 

 


 

top