过期域名预定抢注

 找回密碼
 免费注册

繼續是採集的問題,如何獲得google、bing的緩存頁地址

  [複製鏈接]
發表於 2014-10-13 16:19:32 | 顯示全部樓層 |閱讀模式
今天開始嘗試用火車頭採集google、bing的緩存頁(即快照),但是遇到問題了,緩存頁都需要點開下來箭頭才能顯示出來,在代碼裡又不能看到,不知道怎麼獲取這個地址,有高手能解決嗎
7 e) d* U9 [* Y6 q+ ?& _0 `1 {  p  @0 R( h2 }
回復

使用道具 舉報

發表於 2014-10-13 18:33:49 | 顯示全部樓層
直接採集目標站,而不是快照
% M- l. t; n# F* Y8 L+ i
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-13 21:27:38 | 顯示全部樓層
月光飛燕 發表於 2014-10-13 18:33 + {4 r9 R7 l" f% T  B* {5 t
直接採集目標站,而不是快照
8 q: }: N1 d$ P, v3 r
例如ezinearticles.com這樣的網站會有限制的,直接採集需要的IP多還是採集bing的IP多,就這個問題糾結
% s0 g1 G; b4 A: m- Y( X+ p) z% f
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 22:03:51 | 顯示全部樓層
以前採集用過有道搜索,限制低,現在不知。
! e' p) r" c' f1 k0 \7 e

點評

谢谢分享  發表於 2014-10-13 23:43
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:49:08 | 顯示全部樓層
抓包,快照地址都在json裡面
7 d$ ~" D9 V+ ?

評分

參與人數 1點點 +1 收起 理由
bbbbb111115 + 1

查看全部評分

回復 给力 爆菊

使用道具 舉報

發表於 2014-10-13 23:56:04 | 顯示全部樓層
更改useragent為文本瀏覽器,比如說w3m 或lynx
- a1 }( C. i5 `2 {
" L" L( _# ?/ U( y, L" y普通瀏覽器頁面裡面也有,仔細找! l- a- e) q+ D

4 P3 z" {' e  _( J' W$ V不建議采緩存,不全
5 M9 `  _8 u% _5 A; |
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2014-10-14 09:09:59 | 顯示全部樓層
無言 發表於 2014-10-13 23:49
0 I9 j; v8 e, m1 b抓包,快照地址都在json裡面

  m9 r9 U) ^# |8 @* }2 d7 n9 l可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
; a8 P  g" t# b: m9 }% V! M- M
回復 给力 爆菊

使用道具 舉報

發表於 2014-10-14 21:22:59 | 顯示全部樓層
bbbbb111115 發表於 2014-10-14 09:09 , U1 G0 y9 M4 I* r0 X
可以加我,教教我怎麼抓包,我現在都研究,就是不懂怎麼抓
0 `6 ?0 b1 j; m! V6 j% [0 B
用fiddler抓包,可以百度一下怎麼用! D/ Q  o1 i0 [2 c7 N0 e3 w, ~4 B
4 G' Z3 X% _$ T
回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

过期高净值品牌域名预定抢注

4um點基跨境網編創業社區

GMT+8, 2024-11-24 06:05

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表