过期域名预定抢注

 找回密碼
 免费注册

SEO:Google網站管理員工具的抓取錯誤解決方法

  [複製鏈接]
發表於 2012-6-1 10:52:18 | 顯示全部樓層 |閱讀模式
「抓取錯誤」是 Google網站管理員工具(Webmaster Tools)中最受歡迎的工具之一。它可以幫助你檢查錯誤的鏈接,不僅僅是URL鏈接,還包行DNS解析失敗、服務器鏈接、robots.txt 文件等問題,幾乎所有網站都會出現抓取錯誤。
. z$ {* O, I) q; z: X$ b
( O7 i1 P0 ~- M" c( z  網站站長工具將錯誤分為兩類:網站錯誤(site errors)和鏈接地址錯誤(URL errors)。如果在一個網站上出現多個抓取錯誤,那麼你的網站信任度會下降,甚至會影響到排名,當然這工具對於百度優化同樣有效。那麼應當如何解決Google網站管理員工具的抓取錯誤呢。
$ B3 V  a& M$ {, z( c0 h  ~2 ?0 z7 a, D  d4 ^. S( u0 O# `
通過Googlebot抓取的錯誤分類就看知道是什麼導致抓取錯誤的原因了。- b) w& Z, G$ Y0 L0 \2 p6 J
" P2 _" M( B. ?% W/ [; `/ K/ L
  一、HTTP的錯誤, `. a7 |5 h! g( Q3 `

& T4 q' g- a' y/ n% L9 s6 Z" e$ {  當一個網站上的網頁(例如,當用戶在瀏覽器中訪問您的網頁或Googlebot抓取頁面時)到您的服務器發出請求,服務器返回HTTP狀態碼響應請求。1 M0 |$ W7 z  y$ U* n

2 O1 ]' ]0 m/ d( ]. z  如果出現403狀態,可以不用理睬,這表明是你的主機阻止了Googlebot抓取。對於所有HTTP狀態碼的列表文件,可以參考Google HTTP狀態碼幫助頁面。
: C7 m8 h9 i. `" r
/ Y+ R; I7 r! W2 a" ^, J+ ]  二、Sitemap中的錯誤( ^' o. q* C+ c  V8 W/ `

4 {2 R1 {$ Z" I  Sitemap錯誤往往會造成404錯誤頁面,或在當前地圖返回一個404錯誤頁面,如果出現404錯誤頁面請檢查Sitemap中所有的鏈接,
2 L! U$ ]0 n- }6 g0 t( C: X, A" l' k! a+ B) C
  Google會不斷抓取你已經刪除的Sitemap,這點很鬱悶,但也有辦法解決:確保舊的Sitemap已經在管理員工具中被刪除。如果不想被抓取,確保舊Sitemap出現404或者重新定向到新的Sitemap。  \* I, w) f% g6 Q6 @

  D. R1 Y" `3 I/ D& r  來自Google員工Susan Moskwa解釋道:) V# J: ~- k( ?9 u4 O

4 F6 d  N4 k$ D% Y% R  阻止Googlebot的爬行,最好的辦法是使這些網址(例如舊的sitemaps)出現404,當我們看到一個URL多次出現404後,Googlebot會停止爬行。, r( k# p* E7 A+ \% m( p0 F" ]5 f; W
' W2 z; T# A" n' \+ s3 q
  三、重定向錯誤7 Q7 {* h+ x. u9 t( N

8 ~" ^5 J% O; i  有些錯誤是因為301從定向引起的,執行重定向後要注意什麼:
2 l/ C" [- G1 g/ q; A1 K+ H8 H) g4 n" y7 a+ R  E
  1:確保他們返回到正確的HTTP狀態碼。3 k4 M6 H, U: b! Q- K
7 i" f+ J$ }! ^. b5 T
  2:確保沒有任何循環重定向。
$ t9 ~- H2 v3 b) g+ S: o. K  W1 X, c  U7 }/ `9 e
  3:確保重定向指向有效的網頁,而不是404頁,或其他錯誤頁,如503(服務器錯誤)或403(禁止抓取)* K  b9 A3 M, ]: s
; c8 j  A& f3 Y; E
  4:確保重定向不是指向一個空頁面。; ?4 l* P- L) Q. S9 ]7 f

( m- h$ @9 J% ~+ W2 ~: S2 g" L  四、404錯誤
' i7 b( ?7 `# w0 ^! N5 t8 u  K$ x& ?4 q8 S6 ]- Z" D
  404錯誤可能會出現在以下幾個方面:0 X! W( I/ y9 |8 p; q/ c" l
4 R/ I* b2 g3 e. y( T
  1:刪除了網站上的網頁;: Y6 G* J( [# K  @: |. a2 V: {
4 ^- }9 b4 ~" r2 u
  2:改變了網頁的名稱;# V6 F8 \+ N0 v3 S
6 D6 i* q- Z$ M0 V# v1 e$ X
  4:鏈接到了一個不存在的頁面;' `( t; N5 Q; e6 M# ^: C# u) E
) X& d1 I4 Y" [, d
  5:其他網站鏈接到你網站上一個不存在的頁面;
, N, C  ?8 `2 |& s0 c' c6 v- O1 Z6 P% t" C
  6:網站遷移到一個新的域名不完全匹配的網站。
# C  l! M! C$ c- v; E+ `
" p# ?1 h2 k8 l$ G6 I4 @2 u  五、受robots.txt限制
: x5 ]) m$ `" B$ }4 c+ s9 u1 C3 s4 [7 w8 \8 O
  還有一個原因是robots.txt文件阻止了Googlebot的抓取,如果出現大量抓取錯誤,第一步應該檢查robots.txt
) b( e; ~& F1 _" A& h3 W
2 v- F( E' ?: E2 A* R# W% h  六、軟404錯誤' |: A! F% [$ l( D$ {

6 _4 D1 \9 u6 w* w) O/ N7 x2 B通常情況下,當有人請求的頁面不存在,服務器將返回一個404(未找到)錯誤。除了在響應請求的頁面不存在返回404代碼,服務器也將顯示一個404頁。 這可能是一個標準的「未找到文件」的消息,或旨在提供更多信息的用戶,它可能是一個自定義頁面。 頁的內容是由服務器返回的HTTP響應完全無關。僅僅因為一個頁面顯示404文件未找到消息並不意味著它是一個404頁。
( o# C$ J$ \7 S! r# R0 J0 k# f4 D
7 G7 m! X# i/ Y  {" v七、超時& _, D# ?: Z- a+ N) |$ B4 L7 J

8 O; t- K. X- ~; |0 f: i$ v  網站超時也是出現抓取錯誤的原因之一,如果出現超時現象,Googlebot會停止抓取。超時的錯誤類型有:
* e/ U9 @! u% W# F& }) F+ `
! o7 m! D7 q4 n  1:DNS超時,可以使用Nslookup 命令檢測DNS,出現DNS超時最大的因素是域名服務商的DNS服務器不穩定。
! \5 ~9 c2 o8 S+ `8 U) m
! I8 C0 u* L8 v  }0 Z" n  2:網址超時,在某一個特定頁面,而不是整個域的錯誤。6 ^$ i* Z4 [& p; t8 c# h" J; P
7 L3 R8 D: v0 H1 u4 v
  3:robots.txt超時,如果你網站有robots.txt,但服務器超時,Googlebot會假定該文件不存在。
3 {! ~: x* M8 E$ o  k- E* v$ b! z. V+ G, D/ _* t
  4:動態網頁的響應時間過長而造成網頁載入時間過長。
 樓主| 發表於 2012-6-1 10:52:43 | 顯示全部樓層
在網站上看到的,感覺很好,很有用,跟大家分享一下。
回復 给力 爆菊

使用道具 舉報

發表於 2012-6-2 22:50:47 | 顯示全部樓層
謝謝版主 ,頂一下,支持,
5 d3 a9 V9 u+ q- Chttp://www.i2source.com
回復 给力 爆菊

使用道具 舉報

發表於 2012-6-6 13:53:11 | 顯示全部樓層
Google網站管理員工具確實挺管用的
回復 给力 爆菊

使用道具 舉報

發表於 2012-6-6 14:32:35 | 顯示全部樓層
很好用的工具
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

过期高净值品牌域名预定抢注

點基跨境 數位編輯創業論壇

GMT+8, 2025-4-5 16:10

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表