這是一篇2008年轉帖的帖子,但是本人覺得這篇文章現在對於很多的站長仍然是一篇好文章,所以轉帖了
) c9 O- z( P3 }% J4 m/ r% s: a8 D6 A6 O% n1 h0 k+ f
一SEO的建議:URL標準化
8 O y# i5 e6 K! [! x6 Dadmin 於 2008-1-6,21:34 瀏覽(506)3 B3 v: c$ r& P: y+ p, [+ c
歸類於: SEO優化, 網站建設與網站流量0 u, }* K3 C% l$ c9 K N$ {1 s
標籤:SEO, URL標準化, 站長工具.
6 Q1 G" B, q; E. i 轉載自google中文網站管理員Blog * q' Q& N% Z# i; M5 ]: u
譯自: Matt Cutts Blog! {0 T$ }7 p5 @. A- }+ S8 u
7 ?# Y1 J# _" \/ F
(譯者按: Matt Cutts, google反網絡emu組的帶頭人, 於 2006 年 1 月 4 日在他的個人Blog上發表了」SEO advice: url canonicalization「一文。儘管已快兩年了,Google(google)也為網站管理員提供了站長工具,我們發現對很多站長來說該文仍是一篇很好的 SEO 文章。)
( D% ~. {( {: W* K3 S; d6 L
4 X; |* _+ `9 ^2 i& e% ~+ Y2 T3 k1 F: e$ @
在我開始收集關於 Bigdaddy 數據中心的反饋之前,我想簡略地談一談有關標準化、「www 相對於非 www」、重新定向、重複 URLs、302「劫持」等問題的看法,這樣我們的討論才有共同的基礎。* F3 f8 u# ]1 ^" s* ^ Z$ J
問:什麼是一個標準化 URL ?為什麼要用這麼一個奇怪的字眼?) _% G. c9 w2 s, {. y
答:很抱歉,這是一個奇怪的詞彙;這是google內部對它的稱呼。標準化是一個在若干選項中選取最佳 URL 的過程,這裡通常是指主頁。例如,多數人會將下列 URL 看作相同性質的:# N0 u; t. \: [) x/ M
7 y% f0 O% F4 H# C$ b
* www.example.com
9 W( q# @' {; P: v* ^* example.com/
9 {) L& X( S* i0 R* www.example.com/index.html
$ o% [* B0 { U; k* example.com/home.asp' z' y1 H6 w: Y' |5 k+ t
; l. A5 P) y* r x l但是從技術角度看,這些 URL 都是互不相同的。對於上述 URLs,Web 服務器會返回完全不同的內容。當google「標準化」特定的 URL 時,我們試圖從一整套同類 URL 中選出看起來最具代表性的一個。
+ a ^. k5 v8 u6 X
6 l+ V/ }5 C; I2 j' v, A, R問:那麼我如何能確保google能挑選出我所想要的 URL?. D2 d7 I- A/ U( U3 q8 P- y# D
答:挑選出你想要的 URL,並且在此後一直使用這個 URL 訪問特定網站,這是很有幫助的。例如,不要讓同一個輸入的鏈接一半指向 http: //example.com/ 而另一半則指向 http://www.example.com/ 。相反,挑選一個你喜歡的 URL,並且在你的內部鏈接中總是使用這個格式。
* {6 Z! c$ z" h8 p! Q(譯者註:現在你可以使用站長工具來通過「控制台 > 工具 > 設置首選域名」)。
& x) h3 d3 L6 q+ h+ j: s( b+ |1 l y4 t2 j% p3 M
問:除此之外,我還能做什麼?
. Z5 h$ I' \! A2 F答:比如,如果你希望你的默認 URL 為 http://www.example.com/。那麼,你可以設置你的 web 服務器,這樣如果有人請求 http: //example.com/,它就會產生一個 301 的(永久性)重新定向,鏈接到http://www.example.com/。這樣可以幫助google瞭解到你希望將哪個 URL 作為自己的標準。如果您的網站常有變更(例如動態內容和Blog等),那麼加入一個 301 重新定向可能更便於搜索引擎的定位和捕獲。 |" c! p b. {; X( A
+ p$ l! b+ Z5 l- Z- }1 D& j問:如果我希望去掉 domain.com,但希望保留 www.domain.com,我是否應該使用 URL 清除工具來刪除這個域名?
3 Y8 T- Y6 i$ H* ?答:不要,絕對不要這樣做。對於任何一個 www 域名,或非 www 域名,一旦刪除其結果可能導致該域名在未來六個月內無法恢復。絕對不要這樣做。如果你本想使用 URL 清除工具刪除 www 域名或者非 www 域名,但實際上卻刪除了你所有的域名,請發送一個重新收錄請求,並聲明你用 URL 清除工具不小心刪除了整個域名,現在要求重新收錄。
H6 d. w2 ]) }
, Z* {; ]6 [9 ?7 X$ m% `問:我注意到,你自己並沒有使用 301 重新定向將你的站點從非 www 版本轉向 www 版本,為何沒有這樣做?2 ^$ q6 j: u& J& Y( g
答:實際上我是故意這樣做的。我幾個月之前就注意到了這一點,但決定不自行調整,或者請求google員工幫我搞定它。我或許最終會加入一個 301,但至少到目前為止,它還是一個有幫助的實驗案例。
9 d6 J3 L& h/ n
# ?( c! ?/ H& Z6 J問: 那麼在討論「www 與非 www」時,你也認為這是一種標準化的類型嗎?還有沒有別的方法能實現 URL 的標準化?
# ?$ G. h7 S; M [& w5 n* t6 U, s2 R答:確實還有很多方法,但是多數人不會也無需注意到這些。搜索引擎能夠自動完成諸如保留或者刪除末尾的斜槓、將 URL 從大寫格式轉換為小寫格式,或者將 session ID 從 BBS 或其他軟件上刪除等任務(即使你省略了 session ID,許多 BBS 依然能夠正常運行)。
% Z$ ?9 x; P5 f: ]. u* l" C3 y2 h1 K8 n
問:讓我們談談」inurl:」操作符。為何每個人都認為如果 inurl:mydomain.com 顯示出某些並非來自 mydomain.com 的結果,那麼他一定是被人劫持了?: K6 l4 R7 [: \4 L
答:早先,如果你看到 someresult.com/search2.php?url=mydomain.com,有時候其中會包含來自 mydomain 的內容。如果 someresult.com url 是一個指向 mydomain.com 的 302 重新定向,而我們決定顯示一個來自 someresult.com 的結果,就會產生這種情況。從那以後,我們已經改變了我們的啟發方式,大大降低了 302 重新定向源 URL 的顯示幾率。我們逐漸採納了一個用於處理重新定向的框架,它幾乎總是顯示目的地 URL。雅虎通常採用顯示目的地 URL 的方式來處理 302 重新定向,而我們正處於逐步過渡到一套類似啟發方式的過程中。請注意,雅虎保留了在重新定向的過程中處理所出現的例外的權力,而google也會這樣做。根據我們的分析,我們將在 302 重新定向過程中顯示 URL 源的總概率不到 0.5%(基本上,當我們有足夠的理由相信 URL 源正確無誤時才會顯示)。
- o0 Z- D" z0 N1 W9 N- G% F L1 ^9 W6 M8 I
問:那麼,補充材料又如何呢?補充材料是否會招致google的懲罰?
6 V* m7 ?0 B2 R% Q, P: U' J" K答:不會。
) r* Z# j8 o; Y; @/ T* V7 q. B(譯者註:補充材料已成為歷史。請閱讀補充材料轉為主流一文)。5 J3 F; d2 ]9 D9 X; A- k
/ a7 b* p2 m% ]. Y問:在補充性結果中有我的一些網頁,但這些網頁已經很老舊了。我該怎麼辦? G( c R n4 Y8 M
答:如果換了我,就不會在這方面花太多的精力。如果網頁已經刪除,我會確保有一個 301 重新定向,指向新網頁的位置。如果的確徹底消失了,我會確保服務器返回一個關於這些網頁的 404 錯誤信息。此後,我不會再花費任何精力。當google最終重新抓取那些網頁時,就會發現其中的變化。但是由於我們自己爬取補充性結果的時間間隔要長一些,所以你可能在一段時間內看不到更新 |
|