這是一篇2008年轉帖的帖子,但是本人覺得這篇文章現在對於很多的站長仍然是一篇好文章,所以轉帖了
: z( y7 c: u* j; g) ~" u
2 S# l7 x, b3 E; D, V一SEO的建議:URL標準化
5 \! r7 X% ^! V6 O: Tadmin 於 2008-1-6,21:34 瀏覽(506)
^" C3 z6 J+ V4 ]/ U k/ c- g& f9 f歸類於: SEO優化, 網站建設與網站流量6 u" L) {; {' ?0 L. `1 N
標籤:SEO, URL標準化, 站長工具.
+ o6 e' D3 [. F4 x( m5 U2 w# Y) J 轉載自google中文網站管理員Blog
4 c4 l' b- i% Q$ Y. \% S" e1 s' K- C: e' L 譯自: Matt Cutts Blog
+ M- A& P# D3 I0 Y `. x$ A: H! r7 V* U0 A a( Q
(譯者按: Matt Cutts, google反網絡emu組的帶頭人, 於 2006 年 1 月 4 日在他的個人Blog上發表了」SEO advice: url canonicalization「一文。儘管已快兩年了,Google(google)也為網站管理員提供了站長工具,我們發現對很多站長來說該文仍是一篇很好的 SEO 文章。)3 F- j0 `9 u( ` M% r" L
! Z7 B( g d. u8 k; c6 s) E- f$ f: t4 O7 b& f
在我開始收集關於 Bigdaddy 數據中心的反饋之前,我想簡略地談一談有關標準化、「www 相對於非 www」、重新定向、重複 URLs、302「劫持」等問題的看法,這樣我們的討論才有共同的基礎。
/ S/ i# S" [( k- S1 L3 s問:什麼是一個標準化 URL ?為什麼要用這麼一個奇怪的字眼?
~" H2 L. f- p6 B答:很抱歉,這是一個奇怪的詞彙;這是google內部對它的稱呼。標準化是一個在若干選項中選取最佳 URL 的過程,這裡通常是指主頁。例如,多數人會將下列 URL 看作相同性質的:
, W2 z' u! c/ G* h# \/ Q$ }+ E( d; g% C
6 j/ e' Z d. R! H+ K* www.example.com, C! E1 R/ s5 @6 l7 f' N
* example.com/
# Q4 [/ ^, |. ?: R* www.example.com/index.html
' ?: {, _9 G7 P9 N, S* example.com/home.asp6 q6 t! ]& J8 p2 ?+ _
# T7 h9 N9 P; U! Z" a" D; B& E0 m- W$ A
但是從技術角度看,這些 URL 都是互不相同的。對於上述 URLs,Web 服務器會返回完全不同的內容。當google「標準化」特定的 URL 時,我們試圖從一整套同類 URL 中選出看起來最具代表性的一個。
# E2 {" m$ `/ B( ~0 L3 J
5 Y1 q; o4 ^: ~8 I- T問:那麼我如何能確保google能挑選出我所想要的 URL?: E6 C& P: F3 J2 N
答:挑選出你想要的 URL,並且在此後一直使用這個 URL 訪問特定網站,這是很有幫助的。例如,不要讓同一個輸入的鏈接一半指向 http: //example.com/ 而另一半則指向 http://www.example.com/ 。相反,挑選一個你喜歡的 URL,並且在你的內部鏈接中總是使用這個格式。! k1 h4 H* S0 B, A- B) m S, Q7 S
(譯者註:現在你可以使用站長工具來通過「控制台 > 工具 > 設置首選域名」)。' N/ [0 w* | P& p" Y
% G) z1 Y( h5 B問:除此之外,我還能做什麼?1 C. F. a! s4 P( t
答:比如,如果你希望你的默認 URL 為 http://www.example.com/。那麼,你可以設置你的 web 服務器,這樣如果有人請求 http: //example.com/,它就會產生一個 301 的(永久性)重新定向,鏈接到http://www.example.com/。這樣可以幫助google瞭解到你希望將哪個 URL 作為自己的標準。如果您的網站常有變更(例如動態內容和Blog等),那麼加入一個 301 重新定向可能更便於搜索引擎的定位和捕獲。) ]/ d. w. d1 m5 b: x4 @* G
1 \6 j) G1 G v5 s$ B5 N問:如果我希望去掉 domain.com,但希望保留 www.domain.com,我是否應該使用 URL 清除工具來刪除這個域名?/ ^$ [ I9 ^6 H$ U) N
答:不要,絕對不要這樣做。對於任何一個 www 域名,或非 www 域名,一旦刪除其結果可能導致該域名在未來六個月內無法恢復。絕對不要這樣做。如果你本想使用 URL 清除工具刪除 www 域名或者非 www 域名,但實際上卻刪除了你所有的域名,請發送一個重新收錄請求,並聲明你用 URL 清除工具不小心刪除了整個域名,現在要求重新收錄。
: H$ X& t* F% |! k+ _ U* Q$ [+ c" m
8 g$ p2 `/ K6 }2 |* I問:我注意到,你自己並沒有使用 301 重新定向將你的站點從非 www 版本轉向 www 版本,為何沒有這樣做?
' f% B) l, w* ^; v3 C% j答:實際上我是故意這樣做的。我幾個月之前就注意到了這一點,但決定不自行調整,或者請求google員工幫我搞定它。我或許最終會加入一個 301,但至少到目前為止,它還是一個有幫助的實驗案例。! T' V6 r3 A7 `3 V2 h! O
+ I6 c/ q( {- d* H( B( U& p問: 那麼在討論「www 與非 www」時,你也認為這是一種標準化的類型嗎?還有沒有別的方法能實現 URL 的標準化?
/ A: l2 L9 m& J+ k) x答:確實還有很多方法,但是多數人不會也無需注意到這些。搜索引擎能夠自動完成諸如保留或者刪除末尾的斜槓、將 URL 從大寫格式轉換為小寫格式,或者將 session ID 從 BBS 或其他軟件上刪除等任務(即使你省略了 session ID,許多 BBS 依然能夠正常運行)。
4 F* W/ W4 m M6 l$ H; V8 n$ B4 d: N% u( r I( b
問:讓我們談談」inurl:」操作符。為何每個人都認為如果 inurl:mydomain.com 顯示出某些並非來自 mydomain.com 的結果,那麼他一定是被人劫持了?( Q ?0 D2 b2 S5 |7 {4 v+ t
答:早先,如果你看到 someresult.com/search2.php?url=mydomain.com,有時候其中會包含來自 mydomain 的內容。如果 someresult.com url 是一個指向 mydomain.com 的 302 重新定向,而我們決定顯示一個來自 someresult.com 的結果,就會產生這種情況。從那以後,我們已經改變了我們的啟發方式,大大降低了 302 重新定向源 URL 的顯示幾率。我們逐漸採納了一個用於處理重新定向的框架,它幾乎總是顯示目的地 URL。雅虎通常採用顯示目的地 URL 的方式來處理 302 重新定向,而我們正處於逐步過渡到一套類似啟發方式的過程中。請注意,雅虎保留了在重新定向的過程中處理所出現的例外的權力,而google也會這樣做。根據我們的分析,我們將在 302 重新定向過程中顯示 URL 源的總概率不到 0.5%(基本上,當我們有足夠的理由相信 URL 源正確無誤時才會顯示)。
& ~0 S! e `) j2 U. H [+ w. c# p5 |" }* @/ T: @ K
問:那麼,補充材料又如何呢?補充材料是否會招致google的懲罰?9 u4 g/ t0 `3 a4 \
答:不會。. p3 [5 {8 B9 a% n
(譯者註:補充材料已成為歷史。請閱讀補充材料轉為主流一文)。" U! v. _& e% k N: s9 O: c, x9 q
- @( G* D c: O* e8 }5 `, L+ E問:在補充性結果中有我的一些網頁,但這些網頁已經很老舊了。我該怎麼辦?0 ~9 y* U) |; P) D
答:如果換了我,就不會在這方面花太多的精力。如果網頁已經刪除,我會確保有一個 301 重新定向,指向新網頁的位置。如果的確徹底消失了,我會確保服務器返回一個關於這些網頁的 404 錯誤信息。此後,我不會再花費任何精力。當google最終重新抓取那些網頁時,就會發現其中的變化。但是由於我們自己爬取補充性結果的時間間隔要長一些,所以你可能在一段時間內看不到更新 |
|