本帖最後由 temdan 於 2010-8-18 15:38 編輯 ! O8 Y" J6 \/ Q. X1 q2 M
2 v8 c) ~" ~1 A2 }' Z ~& v4 q今天,我們正式宣佈:新網絡索引系統Caffeine的開發完成了。Caffeine提供 的網絡搜索結果比上一個版本索引的結果新50%,它能給我們提供最多的網絡內容。現在,無論是新聞報道、Blog還是論壇帖,在其發表後,您都可以比以往任何 時候更快地找到相關內容的鏈接。: {: a$ ~) x) |; S6 t m
對於那些不是和我們一樣以構建搜索引擎謀生的人們來說,以下是一些背景知識:當您搜索google時,您在搜索的 不是實時網絡;相反,您搜索的是google的索引,它和書背面的清單一樣,可以幫助您鎖定需要的信息的位置。(可以清楚瞭解索引是如何工作。)
9 g( M9 v# H% x那 麼,我們為什麼要創建一個新的搜索索引系統呢?網絡的內容日益劇增,這不僅僅是數目和容量在增多。隨著視頻、圖片、新聞和實時內容的出現,普通網頁的內容 更豐富也更複雜。此外,人們對搜索的預期也比以往更高。搜索者希望找到最新的相關內容,內容發佈者希望在發佈內容後立即被人搜索到。
" C$ J* y# a W8 p為了 緊跟網絡的發展趨勢並滿足不斷增長的用戶期望,我們創建了Caffeine。下圖將為您演示Caffeine與舊索引系統的工作原理的對比:
+ Y8 E3 r8 z) ^. Y% z; q9 L" x% t8 T5 a; F5 K' H+ e2 F& t( X! s- `
" n! G u- L8 h5 \/ y
) o4 k6 H D, t! V2 `
我們的舊索引有多層結構,它們中間的更新速度不盡相同:有一些會比另外一些更新速度快, 而主層則是幾個星期更新一次。為了更新舊索引的一層,我們必須分析整個網絡,這意味著,在我們找到網頁與讓您訪問該網頁之間,將會有很大的延遲。3 l4 w, O6 K& H6 {' ?! M/ H- m
在 Caffeine系統下,我們分析網絡的小部分,並在全球持續更新我們的搜索索引。當我們發現新網頁,或現有網頁出現新信息時,我們可以將其直接添加在索 引中。這意味著您可以發現比以往任何時候都更新的信息--無論該信息是在什麼時候、什麼地方發佈的。- F9 | ?! D. g- @- n; o* Q+ J
憑借Caffeine我們可以檢索規 模巨大的網頁。事實上,每秒鐘Caffeine能平行處理上幾十萬個網頁。如果這些網頁是一堆紙的話,那麼每秒鐘紙堆都將長高三英里。Caffeine占 據了數據庫中近1億G的儲存空間,並以每天幾十萬G的速度添加新信息。存儲這麼多信息,您需要625,000個存儲量最大的iPod才能完成;將這些 iPod頭尾相連的話,總長將超過40英里。
: x1 r' C2 ]3 D7 i# {! {3 q" ]3 j著眼於未來,我們創建了Caffeine。它不僅可以保證內容更新,還能為我們創建一個更快 速全面、並且隨著網絡信息增長而擴展的搜索引擎打下堅實基礎,從而為您提供更多相關的內容。請做好準備,在未來幾個月裡您可以見證更多的改進。 |
|