amnoob 發表於 2014-2-19 23:35
2 Z R8 u$ X( M; e% Z5 Z' r看了好幾遍才看懂了老兄的意思哇
- Y9 }8 ~, j4 F( e6 v7 `- e2 j% v4 M% M/ \" Y: b9 q+ U8 B, t
我查了一下statcounter的記錄,發現蜘蛛每天都要來呆上半小時 ... ! h1 G1 [, U; y8 a
其實我更傾向於這些ip段不是google bot, 這些ip段 66.249.8x.xxx, hostname是 google-proxy-66-249-8x-xxx.google.com, 而google bot 應該是 crawl-66-249-xx-xxx.googlebot.com這樣的, 像是人工查站一樣,反正它們來了我的採集站必K光, 直接清0。有興趣的歡迎討論一下。4 W- {: R, b4 J9 \: i
0 ^, Y1 Y2 a9 h
有個有趣的現象是,我針對這些ip設置了一下,這些ip來的時候就顯示404,結果這些站都只是降權了,沒有清0,每天還有少量訪問; 而沒有設置的,都清0了。
& m7 y( M. ^: K' u
6 {( R% f) ?7 G o: u: ~搞採集很累的,樓主不搞是明智之舉。
6 J0 a+ J6 ^2 H4 z9 A) z7 u
% L% W% c$ z5 |! \" vPS: 今天掛了一個amazon jp的號, 是amazon.com的來查崗了,我還以為會是日本那邊負責查的呢,損失20多W日元,不多也不少,採集的說掛就掛
+ D Q, Y$ I( b
1 B" h# g) j; l( a5 i( K7 t: M8 G- p) h. L3 [8 L$ p5 {. l
各位遠離採集遠離採集遠離採集。。。3 w$ F+ U' T& V; Y* \. g. ^
. s8 Q) l6 \+ K9 L. ?
|