过期域名预定抢注

 找回密碼
 免费注册

baiduSpider常見問題解答

[複製鏈接]
發表於 2005-2-11 18:01:05 | 顯示全部樓層 |閱讀模式
1. 什麼是baiduspider?
+ L" ~1 Y9 ~9 G# \& ^baiduspider是Baidu搜索引擎的一個自動程序。它的作用是訪問互聯網上的html網頁,建立索引數據庫,使用戶能在Baidu搜索引擎中搜索到貴網站的網頁。 ! K! I* }% m) U/ O! |0 p
- }, `6 \9 |$ Z( i
2. baiduspider為什麼大量訪問我的網頁?
$ O: r  Q- ~" k) M* u! hbaiduspider訪問您的網頁後,會自動分析每個網頁上的文字內容並記憶網頁網址,然後其它網友才能通過百度搜索引擎找到您的網頁。如果baiduspider不訪問您的網頁,那麼所有通過baiduspider提供網頁信息的搜索引擎都找不到您的網頁,也就是說,其它網友在百度搜狐新浪雅虎Tom等幾十個搜索網站都會找不到您的網頁。 
) P, ^. `5 W" k3 {% v  O您可以到這裡進一步瞭解搜索引擎
: Q2 n% C6 ~: C2 s' v$ X/ t6 y+ @9 z* j  S) U6 g% a" }  ]: s
3. baiduspider對一個網站服務器造成的訪問壓力如何?
+ Z+ l5 A+ ]9 i) x0 l5 O& E6 Q) n6 G9 _. \% e
對於一個網站,baiduspider每訪問一個網頁會間隔30秒,不會造成過大壓力。" q2 e  p0 ?( ?" I

: _  P) ]& N- \. E4. 我不想我的網站被baiduspider訪問,我該怎麼做?
# O: v3 {4 M# f9 u. x
1 H- l1 {. z* V$ z) |, w( abaiduspider像其它spider一樣遵守互聯網robots協議。您可以利用robots.txt文件完全禁止baiduspider訪問您的網站,或者禁止baiduspider訪問您網站上的部分文件。, X0 @! m: c/ {. b( e$ T* o. t
! V# p$ L  `9 l1 g  A' b) g
注意:禁止baiduspider訪問您的網站,將使您的網站上的所有網頁,在Baidu搜索引擎以及所有Baidu提供搜索引擎服務的搜索引擎中無法被搜索到,包括搜狐、新浪、雅虎、Tom、Lycos等幾十個搜索引擎。
% ^9 M9 X7 s7 J7 C# ^. h3 o2 f0 C7 `. `8 a% T( _
關於robots.txt的寫作方法,請參看我們的介紹:robots.txt寫作方法
- C& |. ~$ F7 C$ p
8 [/ n4 Z. w3 s) n2 M* u5. 為什麼我的網站已經加了robots.txt,還能在百度搜索出來?. v9 w7 A9 g9 v: H/ r' l

9 A+ e7 Q8 ]' ]- o& R因為搜索引擎索引數據庫的更新需要時間。雖然baiduspider已經停止訪問您網站上的網頁,但Baidu搜索引擎數據庫中已經建立的網頁索引信息,可能需要2到4周才會清除。" z/ \6 ^7 x8 j/ O" m; e
' M' p* ?4 f3 D. j5 {
6. baiduspider多長時間之後會重新抓取我的網頁?
$ F4 m. ^- _& H8 M/ M% X9 y/ @( ^" {# \7 z7 h7 U
Baidu搜索引擎平均兩周更新一次,網頁視重要性有不同的更新率,少則幾天,多則1月,baiduspider會重新訪問和更新一個網頁。
1 m3 L% G) L& k! m- w  o& f
; s' x$ {5 D; W- b7. baidu蜘蛛在robots.txt中的名字是什麼?
  \" N" H9 M0 m4 [$ ^
% e1 C+ C4 }& G4 Y6 m1 zbaiduspider,全部為小寫字母。完全禁止baiduspider訪問的robots文件內容為:
% {! B) T3 I! J: z2 t# s( @  i2 F; r# {( w) G
2 q) U6 h- Z; z* G6 N( F" P
User-agent: baiduspider* s0 e# E6 [$ W( q$ T
Disallow: /
發表於 2005-3-12 17:14:12 | 顯示全部樓層
提示: 作者被禁止或刪除 內容自動屏蔽
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-2-17 20:57

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表