本帖最後由 hardrock 於 2013-11-22 14:34 編輯 V. E" X9 q! l9 N9 i3 c" \
; q9 h, j; X4 c3 y7 o
robots.txt文件要放在網站根目錄下,最基本的檢查方法就是用你的域名後面直接跟上robots.txt訪問,如果能訪問,那放置的位置就對了。
/ K' k, `3 a+ d3 U* W9 _- E
( g. N% Q* c" H7 W$ n2 Q. m找到份代碼,- User-agent: *
; G s( n) `3 m: U, F) B - Disallow: /cgi-bin/+ J1 c1 }! F( M+ Q' r
- Disallow: /wp-admin/5 a# _% _$ X# m, B
- Disallow: /wp-content/cache/. Q/ \! f J6 M7 @
- Disallow: /wp-content/languages/
# p# e O. j# j; a: X - Disallow: /wp-content/plugins/3 v3 @! ]' z$ N- M/ o3 |1 p/ y. k9 p$ q
- Disallow: /wp-content/themes/
) P8 y" m& l6 Q3 Z( G - Disallow: /wp-content/upgrade/
) O9 ]2 A8 s+ u) G - Disallow: /wp-includes/
6 O# h& p& f. @0 w4 z: K: \ - Disallow: /comments/* d! u4 W8 O: I+ t( d6 j
- Disallow: /category/3 F8 |1 {8 \8 |) o
- Disallow: /tag/
" Q# h% M; D% D! k3 U" m4 _& Y' y - Disallow: /page/
% r) A4 V; o x3 N - Disallow: /feed/9 w- R# q a8 d [* g
- Disallow: /author/8 K1 K" F' G4 m# u6 d* K' L# w$ j
- Disallow: /trackback/
2 I! y+ m7 |2 _& m - Disallow: /2010/2 s. t" `# |* ^. Z# H
- Disallow: /2011/6 R, M6 t8 i3 @# M* a
- Disallow: /2012/3 `* m5 Q3 ?: N2 W& X7 C) L
- Disallow: /2013/
' V5 U# n" D+ J: r* H" K) u( Z: i0 d6 h - Disallow: /*/feed/
4 w. e! @' ^+ J( Z - Disallow: /*/trackback/
# f9 Q) X! t, j: C" m - Disallow: /*?. q" H1 @2 S% @* e3 D
- Disallow: /*/*?+ [9 @% L5 K7 M' l* L$ E
- Disallow: /*/*/*?3 A2 O( `, q/ ?) Q* h8 B9 M
- Disallow: /*.php$
+ K5 U' Z( C$ v- I3 X2 {# c% d - Disallow: /*.js$: F& a6 X- d0 A- r& c7 U4 v
- Disallow: /*.inc$$ W) a6 r0 h& n/ v/ n; c7 F0 z
- Disallow: /*.css$
3 c7 w6 C/ u) c L7 K; m -
. C) E) P/ f4 @4 o# i. w: s6 Z - # Google Image
! M% X; `, _+ U9 s7 x3 p3 s0 [4 ?# H - User-agent: Googlebot-Image
! e/ t; S7 p4 h9 c+ l - Disallow:
! L$ R3 v9 T$ A3 J! h" E$ k - Allow: /+ w$ l* A7 I5 J4 {
-
& r+ U" l4 D* K# s# K& N4 c - # Google AdSense9 D! t, u* f+ a$ y y
- User-agent: Mediapartners-Google*- x5 s5 H0 O: z+ C
- Disallow:. d$ E' P$ K% P- i# _! \% i$ X6 D
- Allow: /
2 H$ ]# p% m3 w8 F& e% a9 U0 k -
; q7 m# W- s# h - # digg mirror: n( @7 K2 R, E/ C A1 [
- User-agent: duggmirror
$ G# L& u3 d& t s- [! ~ - Disallow: /5 T8 A& G% u! P, s, v. Q V" X
- 3 g9 }3 X/ w- S. g: M
- # Alexa archiver
: b6 a0 g3 @' u4 ]/ D - User-agent: ia_archiver+ e7 ^) g1 \, S }, L
- Disallow: /
$ E* H# E1 H; ^0 ]3 n" P% u - ! W" L1 P r0 @4 d$ X' Y% t. N
- Sitemap:http://www.xxx.com/sitemap.xml& P) @) ^8 O+ S. \) j5 V$ j
- Sitemap:http://www.xxx.com/sitemap_baidu.xml
複製代碼 問題是這份代碼適用於中文站用於百度,我是做英文站要適用於google, 以上代碼怎樣改成適用英文站的?
' g1 b, t E- f4 ]對於代碼 一竅不通...
* |0 Y, e; ]" O1 Q7 z9 m: `5 {$ X9 |9 _0 T1 _
主要疑問是31----47行的代碼,既然是英文站,這幾行代碼應該是允許的吧?中文站才禁止抓取?
. D% ^# O3 e: \4 J( }4 v9 H
, P/ y) c6 ^! L6 v$ W# ^' l
9 {" ~. b2 \; \6 T4 x9 w
- t7 f, x6 T9 O& \
! Q! J: O) A6 D8 b: I+ j補充內容 (2013-12-22 17:43):. i& [0 S- W; E9 n
沒這麼複雜,下面的就可以了
j$ U' t+ \( O [# C9 L5 T" FSitemap: hxxp://www.xxx.com/sitemap.xml8 u! ~* _7 H2 w2 X! ^
User-agent: *, A& ^* K3 y4 d* ?; A) [
Disallow: /cgi-bin/9 Y, E& X0 l* G5 R9 [
Disallow: /wp-*) v2 B$ q, K; Q% d
* t) m7 M* k3 B9 `7 N6 |* q3 Q補充內容 (2013-12-27 17:17):
2 z2 h( i% R. q( O1 ?http://blog.csdn.net/wallacer/article/details/654289 |