过期域名预定抢注

 找回密碼
 免费注册

繼續是採集的問題,如何獲得google、bing的緩存頁地址

  [複製鏈接]
發表於 2014-10-13 16:19:32 | 顯示全部樓層 |閱讀模式
今天開始嘗試用火車頭採集google、bing的緩存頁(即快照),但是遇到問題了,緩存頁都需要點開下來箭頭才能顯示出來,在代碼裡又不能看到,不知道怎麼獲取這個地址,有高手能解決嗎
) A/ o5 L, v9 w5 l1 V7 u- P' W8 d0 n* L% e! Y3 b, [2 `' g; m! }4 s. Z7 e
回復

使用道具 舉報

發表於 2014-10-13 18:33:49 | 顯示全部樓層
直接採集目標站,而不是快照
; k" v0 @1 w" i6 |8 `! K9 a! ~
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-13 21:27:38 | 顯示全部樓層
月光飛燕 發表於 2014-10-13 18:33
2 A( m. r7 E" v直接採集目標站,而不是快照
" I: E/ I  ?' }/ E
例如ezinearticles.com這樣的網站會有限制的,直接採集需要的IP多還是採集bing的IP多,就這個問題糾結! S/ J  a5 ^) j! J
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 22:03:51 | 顯示全部樓層
以前採集用過有道搜索,限制低,現在不知。1 {" k/ a: z% z; F: t: ]

點評

谢谢分享  發表於 2014-10-13 23:43
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:49:08 | 顯示全部樓層
抓包,快照地址都在json裡面/ R# v8 y6 S, O: t4 y  c2 P

評分

參與人數 1點點 +1 收起 理由
bbbbb111115 + 1

查看全部評分

回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:56:04 | 顯示全部樓層
更改useragent為文本瀏覽器,比如說w3m 或lynx
9 n5 i' ~8 Q9 A& B; u# x* q3 C2 w' Z- a4 p5 y. P! P4 p. M9 }* b
普通瀏覽器頁面裡面也有,仔細找
# r' m3 a4 S8 s# U: m  D" E' j5 u: e/ `% c: g
不建議采緩存,不全
. P' H( c9 d4 [
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-14 09:09:59 | 顯示全部樓層
無言 發表於 2014-10-13 23:49 7 |6 b$ X. `: s! E3 ?
抓包,快照地址都在json裡面
. d' w2 R& Z. d; [9 O8 e5 ?
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓1 D4 z7 ]9 T6 S- D8 k4 T( v
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-14 21:22:59 | 顯示全部樓層
bbbbb111115 發表於 2014-10-14 09:09 + i% a( q: a2 Q) T2 G
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓

' N& T* l5 l# u# y% Z& X, O用fiddler抓包,可以百度一下怎麼用) t( p7 b# U6 R
+ }6 e) }( ~  {4 H; @4 l9 _6 r
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

4um點基跨境網編創業社區

GMT+8, 2024-11-24 02:53

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表