產業快訊 News
更新日期:2013-03-05
Google如何從30兆個獨立網頁,達成月搜1,000億次?
Google公開搜尋背後的工作原理,分享了你我搜尋過程中的有趣數字。
當一次搜尋開始的同時,第一步就是得從30兆個獨立網頁中抓取和索引資料,2008年的Google官方報告還只有1兆個網頁,五年之內就成長為「30兆」個網頁,實在相當驚人;這些資訊全都儲存在Google索引(Google Index),目前大小約為1億GB,大約等同於300萬個我們平常所使用的USB隨身碟。
接著Google試著解讀你到底想要搜尋些什麼,因此演算法在此登場,包括拼音、自動完成文字輸入(autocompletion)、同義詞等功能,當Google認為已經清楚知道你想要知道的是什麼,就會從30億個網頁中將結果拉出,不過此時,Google還不會將結果呈現給你。
Google接下來繼續利用超過200個神祕因素評判搜尋結果,例如網頁品質、網域年份、內容的安全與適切性、以及你的背景資料(像是地點、Google+歷史紀錄、是用平板還是手機等);搜尋結果會在八分之一秒(不會超過太多)就呈現在你的電腦、平板、或是手機上。
千萬別以為這樣就結束了,Google如何測試真的執行了搜尋呢?Google也不全然都是電腦化,也會利用真正的「人力」評估搜尋結果,一年約進行4萬5千次,測試者確認搜尋結果並給予改善建議。那麼關於垃圾網頁的問題呢?無用網頁若是在Google搜尋排名排得很前面,試圖吸引網友點擊,Google會通知該網站,目前每個月約需通知4萬到6萬個這樣類型的網站。
新聞來源 : 數位時代