淘寶和百度最近是打的熱火朝天的,咱們這些旁觀者也不能光看熱鬧啊,得從中學到什麼啊,* j1 n! L \1 o6 a) C N
我們看到,淘寶和百度兩打架,有個傢伙在做怪,那是什麼呢?robots.txt文件,7 w9 ?" t6 T e4 z
下面呢,我就給不知道什麼是robots.txt文件的朋友掃盲,高手可略過,: d" ?2 U, k8 }' `1 F
可能有太多的做搜索引擎優化和網絡營銷的新手朋友經常接觸robots這個詞,但並沒有對它做深入的研究,本文將幫你輕而易舉的理解robots文件的內涵,並且毫不費力的做出符合搜索引擎興趣和心性的robots內容,您只需要花費一點點時間,就能和robots這個傢伙輕鬆成為朋友。何樂而不為呢
2 V v* f& K/ A$ |3 _/ W0 q8 b" I! [3 h4 t! v3 K' [3 R
* |9 x; b, R9 ~" ~想像一下,如果你和robots成為朋友,你就和搜索引擎達成了一個協議,一個建立在平等基礎上的協議,, M6 S+ I% p. n0 q) N7 h
當你擁有robots這個朋友的時候,你就可以輕鬆的對搜索引擎說不了,你的網站上的一些隱私或其它內容當搜索引擎過來訪問時,robots這位朋友就是一位強大的保護神,把搜索引擎拒之門外。
8 I) H1 E" ~7 {5 I: X) S( S6 `8 C+ g2 o) V+ ~1 S
我在這裡不但會告訴你一些怎樣設置robots文件的秘訣,而且還告訴你如何設置它能更加對搜索引擎友好,以有利於你的網站排名,並且教你幾招輕鬆搞定robots函數的辦法: |7 ?0 f0 ]% K# b& F
2 c- p8 V3 s, A! S& `
1,那麼,什麼是robots文件呢,當搜索引擎這個機器人慢悠悠的來到你的網站的時候,它首先看一下你的網站中是不是有robots.txt這個文件,所以說robots.txt文件是搜索引擎已經和我們達成的一個約定,如果我們按約定那樣做了,它們就不要收錄。
! b. s' d% y/ K# ~0 s2 J" _2 S5 p$ i8 X$ f
2。robots.txt文件放在你的網站什麼地方呢,,記住,一定是根目錄下,比如www.123.com/robots.txt,切記不要放到別的地方,8 e% g& q& s2 M% a, s' W9 R
/ F3 z# Z, Q) h' O# N1 O3,robots.txt文件如何設置呢,很簡單,如果你希望網站的網頁全部被抓取,三種辦法,一是不要robots.txt文件,二是建立一個空的純文本文件,命名為robots.txt,上傳到你的空間的根目錄下,如果你不希望網頁被全部抓取,那就設置一下robots函數就可以了,5 J: `* F B5 D- u# r! M
( ?( c' R/ S/ G# N& U2 b+ M, G! F4 在robots.txt文件裡你基本上只用兩個函數就可以了,:User-agent和
" _+ v; ?: y y( r5 KDisallow
* h+ k9 a8 u9 T2 v5 mUser-agent: * 允許所有搜索引擎收錄: G, k0 x5 k# p4 s
《適用於所有搜索引擎》
+ a. S9 ~) D, bDisallow:
2 m6 I! n+ K- O2 V允許訪問所有文件
; e" d; R- l, n; H) F( _& L fDisallow: / 禁止訪問所有的網頁文件
' o' p: M: B* Z K/ E5 FUser-agent: baiduspider
2 i& m9 G0 g, C- ]# e
" I- p# Y9 }0 b% J. RDisallow: / 僅禁止baiduspider訪問您的網站3 P% Y& j, Q2 W3 q7 `; p
User-agent: *) \3 v2 b2 U/ H* P6 J7 \
2 p! J/ n1 s1 XDisallow: /cgi-bin/ 禁止所有搜索引擎訪問cgi-bin/ 目錄下所有文件
6 J. Q' V3 Y" HUser-agent: *- n" d" R! U: r& G- l7 L3 l& u. ~
$ Q+ l! p, N6 |
Disallow: /*?* 禁止訪問網站中所有的動態頁面5 _2 A7 n( S& @3 q# \" e. @+ u
' ]9 b* r) W+ C) W7 w1 O5,接下來我將告訴你如何設置你的robots文件來達到最優化網站的方法,
7 O& S3 V- k$ H7 t6 o' n7 F當你檢查你的網站時,你會發現很多重複或相似的網頁,這些網頁不利於你的網站的權重,所以你就要用到robots這個朋友來禁止一些相似的網頁
+ p/ _5 [" W6 f當你發現一些網頁沒有關鍵詞時,最好用它禁止,1 r3 _* Q/ |1 f$ J0 Y
當你發現一些死鏈接時,最好禁止$ {, _) h2 J# b! C# \
當多個鏈接同指向一個網頁時,最好禁止動態的那些鏈接
0 Y& W( Q( d- s1 N以上所有這些都是對搜索引擎友好的設置& Z" d+ F; \' @0 R0 m+ X
% Q7 l2 F P5 ^0 F9 j3 y7 M3 w5 @6 那麼,設置了robots後多長時間生效呢,一般情況下二十四個小時,
" q/ o3 v0 F' N& M a5 U) H! D4 X9 R當你讀完這篇文章後,是否感到花費了幾分鐘是進學值得的,因為通過這篇文章你對robots文件已經有了更高層次的理解吧,+ w+ I3 X) v7 l! E5 Y
$ W$ G' F0 Z, p4 ?4 A/ y+ ^& d, {好,讓我們看一下我的robots文件設置吧robots.txt |
|