本帖最後由 temdan 於 2010-8-18 15:38 編輯
- `$ k7 }2 E6 H4 {* r( t7 y x8 I+ c7 t2 e* A9 H7 L( E' O# B5 Z$ O
今天,我們正式宣佈:新網絡索引系統Caffeine的開發完成了。Caffeine提供 的網絡搜索結果比上一個版本索引的結果新50%,它能給我們提供最多的網絡內容。現在,無論是新聞報道、Blog還是論壇帖,在其發表後,您都可以比以往任何 時候更快地找到相關內容的鏈接。
# i& G# v V/ Y9 t3 _# X5 E4 M' r對於那些不是和我們一樣以構建搜索引擎謀生的人們來說,以下是一些背景知識:當您搜索google時,您在搜索的 不是實時網絡;相反,您搜索的是google的索引,它和書背面的清單一樣,可以幫助您鎖定需要的信息的位置。(可以清楚瞭解索引是如何工作。)6 c1 X" ^3 s2 E8 @# A
那 麼,我們為什麼要創建一個新的搜索索引系統呢?網絡的內容日益劇增,這不僅僅是數目和容量在增多。隨著視頻、圖片、新聞和實時內容的出現,普通網頁的內容 更豐富也更複雜。此外,人們對搜索的預期也比以往更高。搜索者希望找到最新的相關內容,內容發佈者希望在發佈內容後立即被人搜索到。4 q7 O/ n9 p# N; o! G
為了 緊跟網絡的發展趨勢並滿足不斷增長的用戶期望,我們創建了Caffeine。下圖將為您演示Caffeine與舊索引系統的工作原理的對比:; i4 E' v4 e9 u* b
& Q4 I7 K5 Z' b: o
9 C2 ?+ E8 \/ D' ?% V
* I) _% A$ ^2 D1 g# G: {, S
我們的舊索引有多層結構,它們中間的更新速度不盡相同:有一些會比另外一些更新速度快, 而主層則是幾個星期更新一次。為了更新舊索引的一層,我們必須分析整個網絡,這意味著,在我們找到網頁與讓您訪問該網頁之間,將會有很大的延遲。$ `1 J) g+ o' X" ~
在 Caffeine系統下,我們分析網絡的小部分,並在全球持續更新我們的搜索索引。當我們發現新網頁,或現有網頁出現新信息時,我們可以將其直接添加在索 引中。這意味著您可以發現比以往任何時候都更新的信息--無論該信息是在什麼時候、什麼地方發佈的。
" ]# J0 b, r- K( J- X憑借Caffeine我們可以檢索規 模巨大的網頁。事實上,每秒鐘Caffeine能平行處理上幾十萬個網頁。如果這些網頁是一堆紙的話,那麼每秒鐘紙堆都將長高三英里。Caffeine占 據了數據庫中近1億G的儲存空間,並以每天幾十萬G的速度添加新信息。存儲這麼多信息,您需要625,000個存儲量最大的iPod才能完成;將這些 iPod頭尾相連的話,總長將超過40英里。
& |0 B1 G b. D2 U1 W/ t! d著眼於未來,我們創建了Caffeine。它不僅可以保證內容更新,還能為我們創建一個更快 速全面、並且隨著網絡信息增長而擴展的搜索引擎打下堅實基礎,從而為您提供更多相關的內容。請做好準備,在未來幾個月裡您可以見證更多的改進。 |
|