這是一篇2008年轉帖的帖子,但是本人覺得這篇文章現在對於很多的站長仍然是一篇好文章,所以轉帖了
' e5 U( ?8 X: Y1 e2 s o% ^) B4 m4 q# ?" K
一SEO的建議:URL標準化6 P: s5 O0 t: Q& V; ^
admin 於 2008-1-6,21:34 瀏覽(506)6 O) _. _) x' J
歸類於: SEO優化, 網站建設與網站流量
) p5 E3 Q6 i" [. }8 ]4 w 標籤:SEO, URL標準化, 站長工具.
6 y, J1 u0 O; m& A 轉載自google中文網站管理員Blog 6 Z" O; I; `: {+ C1 y" a9 W- C8 J
譯自: Matt Cutts Blog/ P. Y+ {& m, ?
$ t$ t3 R# n! t
(譯者按: Matt Cutts, google反網絡emu組的帶頭人, 於 2006 年 1 月 4 日在他的個人Blog上發表了」SEO advice: url canonicalization「一文。儘管已快兩年了,Google(google)也為網站管理員提供了站長工具,我們發現對很多站長來說該文仍是一篇很好的 SEO 文章。)" }4 z$ t7 T: k8 O* I+ q6 t! D/ G
0 F7 @2 M+ |* x d2 F9 G& A& k5 x( f7 }
在我開始收集關於 Bigdaddy 數據中心的反饋之前,我想簡略地談一談有關標準化、「www 相對於非 www」、重新定向、重複 URLs、302「劫持」等問題的看法,這樣我們的討論才有共同的基礎。
' V t2 B$ y* V1 z- a問:什麼是一個標準化 URL ?為什麼要用這麼一個奇怪的字眼?4 L( h9 t% J; [- r/ Y/ m$ i
答:很抱歉,這是一個奇怪的詞彙;這是google內部對它的稱呼。標準化是一個在若干選項中選取最佳 URL 的過程,這裡通常是指主頁。例如,多數人會將下列 URL 看作相同性質的:
& p! X1 T. v6 l N/ t# b
4 \; _" }( k- d ]* www.example.com) B& Z+ {# p1 G5 e4 x. } @; F, I
* example.com/
6 y9 ^% o, v& C) a3 ?* www.example.com/index.html1 q4 ^+ N2 w( Y/ R6 E3 L
* example.com/home.asp( r+ N" F* ?& S* d) V
5 L- z4 V3 \; M- ^9 d. r但是從技術角度看,這些 URL 都是互不相同的。對於上述 URLs,Web 服務器會返回完全不同的內容。當google「標準化」特定的 URL 時,我們試圖從一整套同類 URL 中選出看起來最具代表性的一個。
5 ]+ O. x @. N8 B& J
" |' j9 m/ n4 r/ |問:那麼我如何能確保google能挑選出我所想要的 URL?
0 `2 [" c& Q9 [! c1 {答:挑選出你想要的 URL,並且在此後一直使用這個 URL 訪問特定網站,這是很有幫助的。例如,不要讓同一個輸入的鏈接一半指向 http: //example.com/ 而另一半則指向 http://www.example.com/ 。相反,挑選一個你喜歡的 URL,並且在你的內部鏈接中總是使用這個格式。3 U* o8 z2 C0 D4 n/ X9 V, q
(譯者註:現在你可以使用站長工具來通過「控制台 > 工具 > 設置首選域名」)。
& Y. \9 O' z7 O2 ^% X* e8 B' |1 o& m
$ f# }( k7 ]: C; A4 f- B( \問:除此之外,我還能做什麼?
! P" G( p4 u: r4 Y! T& S5 e答:比如,如果你希望你的默認 URL 為 http://www.example.com/。那麼,你可以設置你的 web 服務器,這樣如果有人請求 http: //example.com/,它就會產生一個 301 的(永久性)重新定向,鏈接到http://www.example.com/。這樣可以幫助google瞭解到你希望將哪個 URL 作為自己的標準。如果您的網站常有變更(例如動態內容和Blog等),那麼加入一個 301 重新定向可能更便於搜索引擎的定位和捕獲。! \/ I) ^; M8 U4 q" w1 `# Q( F" [) N: A
8 u3 f3 p# J# U0 c問:如果我希望去掉 domain.com,但希望保留 www.domain.com,我是否應該使用 URL 清除工具來刪除這個域名?5 H8 E! Z/ ^7 T) b! m( ]0 z: Y( x
答:不要,絕對不要這樣做。對於任何一個 www 域名,或非 www 域名,一旦刪除其結果可能導致該域名在未來六個月內無法恢復。絕對不要這樣做。如果你本想使用 URL 清除工具刪除 www 域名或者非 www 域名,但實際上卻刪除了你所有的域名,請發送一個重新收錄請求,並聲明你用 URL 清除工具不小心刪除了整個域名,現在要求重新收錄。
- V6 |1 w. y2 b. x' _9 p7 G- ?' Q2 b5 t
問:我注意到,你自己並沒有使用 301 重新定向將你的站點從非 www 版本轉向 www 版本,為何沒有這樣做?
7 h6 z! O. l, Y% c7 H0 ~答:實際上我是故意這樣做的。我幾個月之前就注意到了這一點,但決定不自行調整,或者請求google員工幫我搞定它。我或許最終會加入一個 301,但至少到目前為止,它還是一個有幫助的實驗案例。
5 V5 [# Z, P+ A6 L; z* ^
$ @; |& o/ B& a: L問: 那麼在討論「www 與非 www」時,你也認為這是一種標準化的類型嗎?還有沒有別的方法能實現 URL 的標準化?
, o( N3 w5 B+ ?. ?( E答:確實還有很多方法,但是多數人不會也無需注意到這些。搜索引擎能夠自動完成諸如保留或者刪除末尾的斜槓、將 URL 從大寫格式轉換為小寫格式,或者將 session ID 從 BBS 或其他軟件上刪除等任務(即使你省略了 session ID,許多 BBS 依然能夠正常運行)。, ^ Q% T& L9 ?6 {/ z
. {- R# Y7 _6 Y& A/ t問:讓我們談談」inurl:」操作符。為何每個人都認為如果 inurl:mydomain.com 顯示出某些並非來自 mydomain.com 的結果,那麼他一定是被人劫持了?* g3 J3 k& X5 u' @
答:早先,如果你看到 someresult.com/search2.php?url=mydomain.com,有時候其中會包含來自 mydomain 的內容。如果 someresult.com url 是一個指向 mydomain.com 的 302 重新定向,而我們決定顯示一個來自 someresult.com 的結果,就會產生這種情況。從那以後,我們已經改變了我們的啟發方式,大大降低了 302 重新定向源 URL 的顯示幾率。我們逐漸採納了一個用於處理重新定向的框架,它幾乎總是顯示目的地 URL。雅虎通常採用顯示目的地 URL 的方式來處理 302 重新定向,而我們正處於逐步過渡到一套類似啟發方式的過程中。請注意,雅虎保留了在重新定向的過程中處理所出現的例外的權力,而google也會這樣做。根據我們的分析,我們將在 302 重新定向過程中顯示 URL 源的總概率不到 0.5%(基本上,當我們有足夠的理由相信 URL 源正確無誤時才會顯示)。
1 t2 \! a B' @. q7 D
& U& s5 P) i9 j& [% ^9 F% S% u問:那麼,補充材料又如何呢?補充材料是否會招致google的懲罰?
3 U" R F8 e: [! r5 u) J答:不會。
5 i5 t' E% s& P' a7 y(譯者註:補充材料已成為歷史。請閱讀補充材料轉為主流一文)。
- Y% l8 r# F% x+ y: ? i+ {& h: R8 s9 V4 X
問:在補充性結果中有我的一些網頁,但這些網頁已經很老舊了。我該怎麼辦?
( ?: M6 {- [, }1 L* J答:如果換了我,就不會在這方面花太多的精力。如果網頁已經刪除,我會確保有一個 301 重新定向,指向新網頁的位置。如果的確徹底消失了,我會確保服務器返回一個關於這些網頁的 404 錯誤信息。此後,我不會再花費任何精力。當google最終重新抓取那些網頁時,就會發現其中的變化。但是由於我們自己爬取補充性結果的時間間隔要長一些,所以你可能在一段時間內看不到更新 |
|