最近研究了下WordPress的RSS採集,但是我幾乎看了所有的插件,都有各種各樣的問題。& M6 p1 z, A8 C5 x3 w
$ A7 q+ a5 ?5 X* x5 m
下面我把我研究的幾個WP的RSS採集插件簡述一下:
6 J# Z, n* W0 [ i2 J+ E5 ~* I/ h, l. v
jay_smart_rss$ R$ T6 C, Q! P, D( a; I
http://www.jaylee.cn/jay_smart_rss/( o4 f% q& m5 k, D" @2 b4 y
這個作者2006年就不更新了,只能用於WP2.2以下的版本,當時還是很不錯的,可惜新版的WP用不起了。我曾試圖修改這個插件,但發現他寫的太亂了,改的話幾乎就是100%,還有他那個rss解析部分寫的來我都看不懂。
) j/ k& m. ?4 v Z7 `6 r) G# G) b" p5 x
FwArtsAutoIn [風度自動文章採集發佈插件]& Z V2 y: @, n# C& t
http://www.flywud.com/wp-content/fwautoinhelp/
# ]9 i- G* G7 f這個使用教程很詳細,而且我發現他還比較新,幾個月前的東西。但是看他教程的常見問題,就知道要是虛擬主機,各種虛擬主機給PHP開的權限和插件不一樣,只有配置較好的,才能用的順暢。我下載試了一下,居然採集了沒反應,好像對windows主機的php主機環境沒反應,懶的去研究代碼了,而且我想到php的採集能力還是比較弱的。6 a E! n9 O% ^- b s* x3 @
* N7 f$ N2 I! y w, k g' V/ j
SMART_RSS
( f) [% u" }! O! }/ S這個插件是老外的,我都沒有下到。聽說很多虛擬主機不兼容,同樣是PHP環境要配置的相當好才行。: _8 N% T2 i* X- V
' b5 A% r9 E: s e火車頭採集
- I0 U: [' i4 E7 T' _ K# E2 t好像有wordpress的採集模塊,但是我不會用火車頭,也不知道採集RSS難不難。但我想新手用起來肯定不是那麼容易的。6 |' x' ^, @% g. R
4 F2 w% o- ?# p' m1 b( o
& c9 m$ Q0 R7 O
+ T9 K% r3 [$ G5 J寫個軟件版的『WordPressRSS採集助手』+PHP版的採集插件9 U, C/ ~, Y! o; W9 }2 }8 }8 y
功能比較簡單,遠比不上火車頭,但是專一,且使用簡單,就是採集各種RSS到WordPress( A8 I. G) V( f* Z$ E! L
最重要是新手用起來簡單無比
: l [ D: {2 J/ j; G, o8 }, T. z. t3 H& [4 V( L3 v7 U! Q
此軟件和插件共花時間2個晚上(我晚上才工作)
t. p" {9 Q' O3 q, e. M) a; `; t* G9 f. ]/ n+ r1 A# _$ Q1 I9 e- x
介紹下它的功能:
: S8 ]& B8 J: e# T$ X% h3 r: a2 z) h9 j3 o" F8 p0 Y& P7 Y
WordPressRSS採集助手,負責採集RSS工作,它比PHP採集要快和強,使用多線程,不超過5個
% S/ C7 L) ]& x: P; Q! {. xWordPressRSS採集助手將採集到的數據通過橋連接的方式發送到PHP的插件頁面,由插件負責保存到數據庫的工作。
% [3 \! d2 k1 |8 e' L數據直接入庫,中間不經過任何wordpress的自帶環節,就是說只要有數據庫表,沒安裝wordpress都可以採集入庫。0 c: A9 U: B$ E$ g9 Q3 E& N
軟件已自帶文章去重複功能,重複的文章是會自己避開的。4 B, M: U+ ^ ~9 U& k; l) L
7 K: c2 a. V4 {9 y7 D9 [! ]/ M' X, }* N/ J$ d6 ]9 i C! Y
介紹它的使用方法:: y$ { N% a* K$ o7 s/ W, I, w
6 K9 X$ { q; w: r# W3 K添加一個RSS鏈接就不說了,關鍵是RSS的節點配置) a* ]: o4 q$ y. I" O/ f k. @
) u8 _: ^6 C. D6 B8 \3 U2 D' G% D( `4 Y
比如一個RSS文本如下
- `7 A1 Q& A5 M2 I+ `1 B- - <rss version="2.0">0 o& m' Z: C; e: {
- - <channel>
8 r, h2 v9 n' y# r4 n - - <item>
- A- d9 E! W J4 g% ^ - <title>外形很唬人 "啤酒瓶"造型電話現身</title> 2 f |* y# p8 _9 @7 u8 y' j& p
- <span>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</span>
! _8 ?& n9 b7 q S& ` - <guid>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</guid> & |$ t: s/ `" k
- <pubDate>Wed, 15 Oct 2008 11:00:05 GMT</pubDate>
& {4 j, }7 s! Y* n* J+ d5 P - - <description>
& K+ C6 y* Y( W: O) b3 ^$ t Q - - <![CDATA[ 內容]]>
. [& `! Z5 B+ d - </description>
7 A8 ~- l: ?+ I1 J' O9 z - </item>; K8 \$ J( Q. e$ a* h1 g; E
- </channel>- y o* T/ N C! e3 Z
- </rss>
複製代碼 8 u3 y: y7 w& Q2 a1 q4 O+ u
( C# W3 ^) u0 a+ m1 R標題路徑:就是wordpress發貼時的標題,你想想,你是不是應該把上面RSS中,路徑 rss/channel/item/title 作為標題路徑呢。+ m- d3 r0 F) |/ b; u
文章內容路徑:就是wordpress發貼時的標題對應的內容,路徑應該是 rss/channel/item/description: r! h( K0 h: d2 P( t) k! `1 A
8 H O7 H8 a: @- s) ^# ^
這裡不要想複雜了,其實異常的簡單,就是標籤的絕對路徑,只要你找準了,就能正確解析RSS。5 |1 q2 K! Q# U% ]% y
! O1 ]. T- v$ u. @這裡可比火車頭的採集規則簡單得多。( a! Z, z9 ^$ O
! d0 \6 O( L7 m7 X- E ]
! S! O/ C: u" Z, g# W8 S
- F# ]$ O6 n2 l4 O* B# W* W
6 {$ P! N0 Q9 B; D+ b其他也沒有好說的了,要注意的是,採集的時候,一個鏈接採集了一次要隔一段時間再去採集,太頻繁了會被封一會。) [3 o' f: f* x7 b0 E
) E" B, D& }) ]4 o1 p6 S( I- b: R/ J4 r1 @: r1 b* k( Y
說下為什麼沒有做全自動的每天自動採集:
# ?- v. t* l1 O2 y7 J6 I' l1.因為我本人不提倡和不喜歡採集/ `- s( y, \3 _+ T/ D4 }0 O3 ^
2.RSS更新很慢,每天手工點一下,這樣也有助於你收錄,因為搜索引擎不喜歡大量的搜錄,如果你每天或隔幾天才多出少許的新文章,這樣的站搜索引擎才不會認為你再採集。
, A$ Z5 o8 u) ?8 ^- F3.這個軟件第一版我看下反響,再考慮以後的版本功能,要是反應不好我就不做了。4 e9 f+ ~5 T }- S
4.假如有超強的全功能版本,我會收取少量費用,第一版就免費了,功能還是蠻不錯的。 w- t) k6 [1 B* U' @ ]+ Z
8 c5 Q+ t5 E- h/ h: T$ \% x' J# I4 x, }' `
軟件的安裝:0 z! V) h# C, b& v! z. v
0 w, I$ B4 w3 y+ w9 v/ \" n/ [3 \1.上傳 月光RSS採集插件 hyrinlight_gather_rss.php 到你的wordpress插件目錄
* o9 w# Z q8 d$ Y0 p6 _2 Q2 @! L) f- f2 s5 T- K
2.打開助手,添加插件準確位置,保存。, ?7 X8 t" u0 }- a0 x/ s; P" R
2 g$ Q: T6 p. [2 b- l' q, y2 d5 M: A
3.添加新的RSS鏈接,並設置採集節點。
3 U8 f3 p+ J* S1 ]1 N* h8 F# q! w5 [
4.開始採集並檢查結果。
7 Y+ w. k' I; i1 i' e
" x) L2 a8 S2 z0 \. g% X
" ^; Y# c! i1 O' [6 r$ D! u& o5 m- |' r4 n! z% v
5 r' l3 r+ @' V! @0 I. q
$ o8 d* g# Y- \最後附截圖 |
評分
-
查看全部評分
|