过期域名预定抢注

 找回密碼
 免费注册

自己被採集之後才開始思考如何防採集(轉貼)

[複製鏈接]
發表於 2007-10-31 14:18:18 | 顯示全部樓層 |閱讀模式
老實說,做垃圾站的時候經常採集別人的內容,甚至直接用小偷程序。但當自己辛苦做的本地分類信息網站被別人採集時,心裡的滋味還是很不好受的。4 `, J# ]; L$ V5 l! ~; [
如今每一個CMS系統都有採集功能,似乎沒有了採集網站就做不下去。既然落到自己頭上,總是要解決的。花了1個下午的時間,考慮了幾種思路,最終用一個簡單易行的方法,暫時解決了這個問題。
' n4 g# e0 u  z# ~解決採集主要是下面3個方法:* |5 `8 M5 ]" Q: H: o9 O
1、圖片輸出。
7 A7 q- c9 W& B5 @把重要的數據直接作為圖片輸出,據說起點小說的vip章節就是這樣實現的。這個方法非常徹底,缺點是消耗服務器性能和磁盤空間。
' @: R# {4 ?4 m+ P/ q9 ?9 n2、動態模板。1 X6 z# }, `) Z0 F
採集都是通過制定好餓規則,所以如果讓被採集頁面沒有規則,那麼依然可以防採集。可以事先做好N套模板,最終效果都挺相似,但是HTML代碼結構卻不同。比如有一些用<strong>有一些用<B>,有一些用div,有一些用table。每次顯示或者輸出時隨機調用模板。一旦這樣,除了「人肉」,基本上可以防住絕大部分的採集程序。0 {& Z" L: Y+ l2 Z& o
3、利用客戶端狀態。( w1 Z5 F! G7 ~; e( R
利用客戶端狀態來防止採集也是一種方法。比如要求網有登錄之後才能瀏覽,判斷瀏覽器是否是IE或者firefox,判斷是否在1分鐘內瀏覽了超過20或者30頁等 。不過現在比較好的程序都能模擬客戶端狀態,而且本身對很多大站來說是不切實際的。所以一般在論壇中使用的比較多。; D# Y4 p/ `6 w  K' Y) c; m0 g
由於我的網站核心信息僅僅是聯繫方式和發佈ip地址。所以最終我採用了第一種,直接輸出圖片並打上毒命標記。事實證明效果非常好。由於在程序中做了優化,實際運行時對性能的影響微乎其微。可以到(如果認為AD,可以不點擊)看看最終頁面的效果。玩新後會發現圖片的微小變化。
2 F' d4 W4 Q* z dd.jpg ; x3 C( C/ F$ F7 S. w* U8 z
本文來自: 站長網
9 E' s. S+ O3 {; q; }' k# _7 O6 L
[ 本帖最後由 lojofo 於 2007-10-31 14:34 編輯 ]
發表於 2007-10-31 21:40:53 | 顯示全部樓層
也就那麼一回事兒  :
回復 给力 爆菊

使用道具 舉報

發表於 2007-10-31 21:43:39 | 顯示全部樓層
添加IP來源判斷,一分鐘內玩新超過限制的非搜索引擎IP禁止訪問。
回復 给力 爆菊

使用道具 舉報

發表於 2007-10-31 22:00:02 | 顯示全部樓層
隨機模板防採集 dedecms有~效果還可以~但是對於高手來說~也沒用!: ; V& W7 G9 b5 k" _! ^  p. v
封IP的辦法也可以對付!
# @' a, I8 h+ V9 h( [$ n- r1 U- ^這些方法只能增加採集的難度~不能完全防止採集
回復 给力 爆菊

使用道具 舉報

發表於 2007-11-2 12:56:08 | 顯示全部樓層
第一種如何實現
回復 给力 爆菊

使用道具 舉報

發表於 2007-11-3 13:17:39 | 顯示全部樓層
回復 给力 爆菊

使用道具 舉報

發表於 2008-1-9 10:00:51 | 顯示全部樓層
最好的是圖片輸出方式,恩,最好程序實現.
回復 给力 爆菊

使用道具 舉報

發表於 2008-1-9 15:42:09 | 顯示全部樓層
動態模板不錯的~dede能實現
回復 给力 爆菊

使用道具 舉報

發表於 2008-1-10 17:21:07 | 顯示全部樓層
網絡建站,你採集他的,他採集你的,一味的防止採集沒有意義,留住用戶才是根本
回復 给力 爆菊

使用道具 舉報

發表於 2008-2-21 10:58:00 | 顯示全部樓層
看技術
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

过期高净值品牌域名预定抢注

4um點基跨境網編創業社區

GMT+8, 2024-11-28 03:18

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表