过期域名预定抢注

 找回密碼
 免费注册

如何寫好WordPress網站的robots.txt文件?

[複製鏈接]
發表於 2013-11-22 14:23:30 | 顯示全部樓層 |閱讀模式
本帖最後由 hardrock 於 2013-11-22 14:34 編輯   V. E" X9 q! l9 N9 i3 c" \
; q9 h, j; X4 c3 y7 o
robots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。
/ K' k, `3 a+ d3 U* W9 _- E
( g. N% Q* c" H7 W$ n2 Q. m找到份代碼,
  1. User-agent: *
    ; G  s( n) `3 m: U, F) B
  2. Disallow: /cgi-bin/+ J1 c1 }! F( M+ Q' r
  3. Disallow: /wp-admin/5 a# _% _$ X# m, B
  4. Disallow: /wp-content/cache/. Q/ \! f  J6 M7 @
  5. Disallow: /wp-content/languages/
    # p# e  O. j# j; a: X
  6. Disallow: /wp-content/plugins/3 v3 @! ]' z$ N- M/ o3 |1 p/ y. k9 p$ q
  7. Disallow: /wp-content/themes/
    ) P8 y" m& l6 Q3 Z( G
  8. Disallow: /wp-content/upgrade/
    ) O9 ]2 A8 s+ u) G
  9. Disallow: /wp-includes/
    6 O# h& p& f. @0 w4 z: K: \
  10. Disallow: /comments/* d! u4 W8 O: I+ t( d6 j
  11. Disallow: /category/3 F8 |1 {8 \8 |) o
  12. Disallow: /tag/
    " Q# h% M; D% D! k3 U" m4 _& Y' y
  13. Disallow: /page/
    % r) A4 V; o  x3 N
  14. Disallow: /feed/9 w- R# q  a8 d  [* g
  15. Disallow: /author/8 K1 K" F' G4 m# u6 d* K' L# w$ j
  16. Disallow: /trackback/
    2 I! y+ m7 |2 _& m
  17. Disallow: /2010/2 s. t" `# |* ^. Z# H
  18. Disallow: /2011/6 R, M6 t8 i3 @# M* a
  19. Disallow: /2012/3 `* m5 Q3 ?: N2 W& X7 C) L
  20. Disallow: /2013/
    ' V5 U# n" D+ J: r* H" K) u( Z: i0 d6 h
  21. Disallow: /*/feed/
    4 w. e! @' ^+ J( Z
  22. Disallow: /*/trackback/
    # f9 Q) X! t, j: C" m
  23. Disallow: /*?. q" H1 @2 S% @* e3 D
  24. Disallow: /*/*?+ [9 @% L5 K7 M' l* L$ E
  25. Disallow: /*/*/*?3 A2 O( `, q/ ?) Q* h8 B9 M
  26. Disallow: /*.php$
    + K5 U' Z( C$ v- I3 X2 {# c% d
  27. Disallow: /*.js$: F& a6 X- d0 A- r& c7 U4 v
  28. Disallow: /*.inc$$ W) a6 r0 h& n/ v/ n; c7 F0 z
  29. Disallow: /*.css$
    3 c7 w6 C/ u) c  L7 K; m

  30. . C) E) P/ f4 @4 o# i. w: s6 Z
  31. # Google Image
    ! M% X; `, _+ U9 s7 x3 p3 s0 [4 ?# H
  32. User-agent: Googlebot-Image
    ! e/ t; S7 p4 h9 c+ l
  33. Disallow:
    ! L$ R3 v9 T$ A3 J! h" E$ k
  34. Allow: /+ w$ l* A7 I5 J4 {

  35. & r+ U" l4 D* K# s# K& N4 c
  36. # Google AdSense9 D! t, u* f+ a$ y  y
  37. User-agent: Mediapartners-Google*- x5 s5 H0 O: z+ C
  38. Disallow:. d$ E' P$ K% P- i# _! \% i$ X6 D
  39. Allow: /
    2 H$ ]# p% m3 w8 F& e% a9 U0 k

  40. ; q7 m# W- s# h
  41. # digg mirror: n( @7 K2 R, E/ C  A1 [
  42. User-agent: duggmirror
    $ G# L& u3 d& t  s- [! ~
  43. Disallow: /5 T8 A& G% u! P, s, v. Q  V" X
  44. 3 g9 }3 X/ w- S. g: M
  45. # Alexa archiver
    : b6 a0 g3 @' u4 ]/ D
  46. User-agent: ia_archiver+ e7 ^) g1 \, S  }, L
  47. Disallow: /
    $ E* H# E1 H; ^0 ]3 n" P% u
  48. ! W" L1 P  r0 @4 d$ X' Y% t. N
  49. Sitemap:http://www.xxx.com/sitemap.xml& P) @) ^8 O+ S. \) j5 V$ j
  50. Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼
問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?
' g1 b, t  E- f4 ]對於代碼 一竅不通...
* |0 Y, e; ]" O1 Q7 z9 m: `5 {$ X9 |9 _0 T1 _
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?
. D% ^# O3 e: \4 J( }4 v9 H
, P/ y) c6 ^! L6 v$ W# ^' l
9 {" ~. b2 \; \6 T4 x9 w
- t7 f, x6 T9 O& \
! Q! J: O) A6 D8 b: I+ j補充內容 (2013-12-22 17:43):. i& [0 S- W; E9 n
沒這麼複雜,下面的就可以了
  j$ U' t+ \( O  [# C9 L5 T" FSitemap: hxxp://www.xxx.com/sitemap.xml8 u! ~* _7 H2 w2 X! ^
User-agent: *, A& ^* K3 y4 d* ?; A) [
Disallow: /cgi-bin/9 Y, E& X0 l* G5 R9 [
Disallow: /wp-*) v2 B$ q, K; Q% d

* t) m7 M* k3 B9 `7 N6 |* q3 Q補充內容 (2013-12-27 17:17):
2 z2 h( i% R. q( O1 ?http://blog.csdn.net/wallacer/article/details/654289
發表於 2013-11-22 15:02:27 | 顯示全部樓層
好像禁止了動態收錄?具體聽高手解答~
6 t9 X& T3 @& k$ F
回復 给力 爆菊

使用道具 舉報

發表於 2013-11-22 21:26:40 | 顯示全部樓層
我第一次看到這個robots.txt是在英文站.....8 V* ]) T8 X, c) i+ V5 [" y5 ]
可以用於英文站/ p: V9 p3 A# q; e7 w
回復 给力 爆菊

使用道具 舉報

發表於 2013-12-10 14:14:56 | 顯示全部樓層
: f0 W" K7 V* y8 m1 v
6 t; B/ l" t4 j# @. u& k8 t

  W# T2 Q2 b/ t- F; o和競爭對手學習呀,他們是你最好的老是& M( R/ w7 P! S5 q5 k( l( q

4 Z- l! q; s9 H/ z; f: _
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

4um點基跨境網編創業社區

GMT+8, 2024-11-23 21:53

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表