老實說,做垃圾站的時候經常採集別人的內容,甚至直接用小偷程序。但當自己辛苦做的本地分類信息網站被別人採集時,心裡的滋味還是很不好受的。
# t. E- V( Q4 s* {& Z# c如今每一個CMS系統都有採集功能,似乎沒有了採集網站就做不下去。既然落到自己頭上,總是要解決的。花了1個下午的時間,考慮了幾種思路,最終用一個簡單易行的方法,暫時解決了這個問題。
- @1 a$ N n+ t5 E- T0 `/ x解決採集主要是下面3個方法:
) N& A0 z B% K" F0 D" R1、圖片輸出。
! n- L, F; ~. S; U1 b2 G8 Z把重要的數據直接作為圖片輸出,據說起點小說的vip章節就是這樣實現的。這個方法非常徹底,缺點是消耗服務器性能和磁盤空間。
+ T% P9 i: Z2 a- Z$ @2、動態模板。9 p7 U, f S1 M7 R" [& Q7 _
採集都是通過制定好餓規則,所以如果讓被採集頁面沒有規則,那麼依然可以防採集。可以事先做好N套模板,最終效果都挺相似,但是HTML代碼結構卻不同。比如有一些用<strong>有一些用<B>,有一些用div,有一些用table。每次顯示或者輸出時隨機調用模板。一旦這樣,除了「人肉」,基本上可以防住絕大部分的採集程序。
% q- R9 Z8 I9 h7 G7 k3 [; K3、利用客戶端狀態。
' {, x5 j6 ^" N' \, D: M利用客戶端狀態來防止採集也是一種方法。比如要求網有登錄之後才能瀏覽,判斷瀏覽器是否是IE或者firefox,判斷是否在1分鐘內瀏覽了超過20或者30頁等 。不過現在比較好的程序都能模擬客戶端狀態,而且本身對很多大站來說是不切實際的。所以一般在論壇中使用的比較多。
6 I! I; U5 c+ L由於我的網站核心信息僅僅是聯繫方式和發佈ip地址。所以最終我採用了第一種,直接輸出圖片並打上毒命標記。事實證明效果非常好。由於在程序中做了優化,實際運行時對性能的影響微乎其微。可以到(如果認為AD,可以不點擊)看看最終頁面的效果。玩新後會發現圖片的微小變化。& ~3 S" h( O9 `* a1 E
. K/ B9 r5 O& X {$ m
本文來自: 站長網) a% w, G8 @% K, Y3 u
" t9 r6 v9 x# b V[ 本帖最後由 lojofo 於 2007-10-31 14:34 編輯 ] |
|