發表於 2013-8-18 11:11:14
|
顯示全部樓層
- o$ J y; i' R- v3 Z
$ ~4 B' v* }0 f4 f
3 Y1 i( H# x; g4 r, r群主啊,沒有權限私密,借地問個問題,想採集一個頁面的列表做文章標題,但是這個列表是時刻變動的,但只有部分變動,估計每天有3萬的數據吧,但不知道有沒有重複循環的,如果做標題是不能重複的,我該怎樣來採集呢??如果沒採集一個都要去重的話,數據量有百萬的話會很費勁很慢,這該如何是好呢??
& Q5 l" G" }( o- P, Z0 o: @# s) F( a! i0 \ S2 g: O$ @
|
|