|
||||
Google今天宣布,新的Web索引系統Caffeine(咖啡因)正式完成,其索引結果是當前Google索引工具的1.5倍,這也是Google迄今為止所提供的Web內容的最大量。無論是新聞、博客、論壇帖子,你都可以在其發布後更快地找到其鏈接。
在解釋為什麼開發新的搜索索引系統時,Google表示:『Web內容欣欣向榮,它不僅在大小和數量上取得了增長,內容也不斷變化,出現了視頻、圖片、新聞和實時更新,普通的網頁變得更加豐富和復雜。此外,人們對搜索的要求也在比從前高很多,搜索者希望找到最想要的內容,發布者希望新發布的內容立刻被找到。』
『為了適應Web的變革並滿足人們日益增長的需求,我們開發了Caffeine(咖啡因),下圖描述了傳統索引系統與Caffeine的區別:』
傳統的索引分為很多層,其中一些會以較快的速度更新,而主要內容層則會每幾周纔更新一次。在更新一個層時,Google需要對整個Web進行分析,這也就意味著在Google發現一個頁面與提供給用戶這之間有一個延遲。
在Caffeine中,『我們只在小的范圍內分析Web內容,並不間斷地更新索引,進而設計全球網絡內容。一旦我們發現新的頁面或現有頁面上更新了內容,我們可以直接將其添加到索引中,也就是說,你可以更快地搜索到新的Web內容。』
Caffeine每秒可以並行處理數以萬計的頁面,如果這些網頁以紙張堆積起來,那麼每秒鍾它可以增高近5000米。Caffeine在每個數據庫中佔據100,000,000 GB的存儲空間,每日的新增量也十分驚人。你需要625000個最大容量版本iPod纔能存儲這麼多數據,它們首尾相連能超過64公裡。