最近研究了下WordPress的RSS採集,但是我幾乎看了所有的插件,都有各種各樣的問題。' m4 ]; X8 z- }; N: g' W' h
: _9 f' T7 c$ i" J8 \) S下面我把我研究的幾個WP的RSS採集插件簡述一下:
6 @5 _) Q! ]* f# D4 G" y
! _" x; \: V5 a' |jay_smart_rss; z4 r1 ^( r" H! k' Z& j9 ~& g; X
http://www.jaylee.cn/jay_smart_rss/
) \$ |8 F' e7 W這個作者2006年就不更新了,只能用於WP2.2以下的版本,當時還是很不錯的,可惜新版的WP用不起了。我曾試圖修改這個插件,但發現他寫的太亂了,改的話幾乎就是100%,還有他那個rss解析部分寫的來我都看不懂。
! J O. f( ? T' Z( v( e) e
' h( j* v* x. J) l+ t6 vFwArtsAutoIn [風度自動文章採集發佈插件]
3 \0 R# B! H2 Z5 b9 D( mhttp://www.flywud.com/wp-content/fwautoinhelp/
( \" p( b* d% o- k這個使用教程很詳細,而且我發現他還比較新,幾個月前的東西。但是看他教程的常見問題,就知道要是虛擬主機,各種虛擬主機給PHP開的權限和插件不一樣,只有配置較好的,才能用的順暢。我下載試了一下,居然採集了沒反應,好像對windows主機的php主機環境沒反應,懶的去研究代碼了,而且我想到php的採集能力還是比較弱的。
# h- M' Y6 I' } |2 F% ?5 T! M; O( W
SMART_RSS
7 O0 G# s3 I' A) d, Q# V6 n這個插件是老外的,我都沒有下到。聽說很多虛擬主機不兼容,同樣是PHP環境要配置的相當好才行。& M4 d9 u, `& G, q$ x& h8 b
$ K& u9 `2 R- l6 z2 \8 ^- v火車頭採集
- i; a* n5 T2 U$ u% Q7 ?好像有wordpress的採集模塊,但是我不會用火車頭,也不知道採集RSS難不難。但我想新手用起來肯定不是那麼容易的。
, _0 z4 k' I* W. R6 t: ^; R) D1 V8 o# ?( l6 f/ g {2 _
/ f/ O4 Y) |: Q. e
6 Q# X3 _5 a: `9 Y寫個軟件版的『WordPressRSS採集助手』+PHP版的採集插件7 Y3 i- V7 X' p0 k9 t) k. v2 s
功能比較簡單,遠比不上火車頭,但是專一,且使用簡單,就是採集各種RSS到WordPress
6 k1 {, l0 F* b4 n2 y最重要是新手用起來簡單無比
- e; K& l& H7 X% d8 F
, ?, m* R* o. @: A8 R* g此軟件和插件共花時間2個晚上(我晚上才工作)
2 y) S5 T/ p$ }% p6 O8 d5 x7 [/ A- f6 x1 X- O3 m' @
介紹下它的功能:
; s- C. {' x5 G8 E: `- q! i9 a! x, `7 V, W) p! N& I
WordPressRSS採集助手,負責採集RSS工作,它比PHP採集要快和強,使用多線程,不超過5個+ f3 b$ M c0 u4 N# J/ ^/ c2 e
WordPressRSS採集助手將採集到的數據通過橋連接的方式發送到PHP的插件頁面,由插件負責保存到數據庫的工作。) p" _1 s& f* s, {' h% E
數據直接入庫,中間不經過任何wordpress的自帶環節,就是說只要有數據庫表,沒安裝wordpress都可以採集入庫。% s: q* E& v! f Z- [& h
軟件已自帶文章去重複功能,重複的文章是會自己避開的。. Q+ J$ x% k0 }# n" o; ?/ M6 y" m
; R; }0 S; }, a0 E0 Z2 r
: z$ z% \. U. Y; b介紹它的使用方法:* l) a y/ \. |& f( X
% [6 @" P" ~" L. ~添加一個RSS鏈接就不說了,關鍵是RSS的節點配置# g% m/ }9 y% I2 Z
! p9 e4 l* { p
比如一個RSS文本如下
" U& u. k7 e7 Q- - <rss version="2.0">; z. V0 p2 k- x4 q
- - <channel>
: _; u. A' V8 R6 E5 v+ M+ y% M8 `8 K - - <item>& C; C0 q; `" m9 O9 Q/ o0 N
- <title>外形很唬人 "啤酒瓶"造型電話現身</title> ; p W, T$ H9 F+ [# ?4 W9 U! e
- <span>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</span>
; K, q+ L2 `9 @( ]" L+ r - <guid>http://news.dayoo.com/photo/200810/15/54034_4282360.htm</guid> ; l+ u/ W+ W# f2 u
- <pubDate>Wed, 15 Oct 2008 11:00:05 GMT</pubDate> 2 G3 s! X/ k, g# {$ f0 q! {
- - <description>
9 _+ C4 w# D1 ? `$ t) w7 g f1 ~ - - <![CDATA[ 內容]]> ; O! v1 Y( V# s% g( Y2 q- X/ w
- </description>
2 l n7 \1 M' @/ m1 T# Y - </item>
6 y& }4 `0 o) B5 o - </channel>
! W J5 p& k$ m) V Q - </rss>
複製代碼 * p6 y0 ? n; T1 {
" V, z1 S) D, {( F9 Y- k6 m
標題路徑:就是wordpress發貼時的標題,你想想,你是不是應該把上面RSS中,路徑 rss/channel/item/title 作為標題路徑呢。
3 `2 w5 B) w% F3 ^% Q4 q, r7 Q文章內容路徑:就是wordpress發貼時的標題對應的內容,路徑應該是 rss/channel/item/description/ T* V9 t5 @+ t5 u/ r
3 t: t5 U" M5 v" q/ k1 L" c
這裡不要想複雜了,其實異常的簡單,就是標籤的絕對路徑,只要你找準了,就能正確解析RSS。+ K9 S9 C2 V% c- v
! l, D# ]: R3 |4 x
這裡可比火車頭的採集規則簡單得多。2 h! z/ R* A, p0 N
$ V p( e3 w- s( e5 g. E
$ \- q% l3 z- ^- h1 M# K- R4 x3 {0 T$ @3 K
/ X4 s+ i) Q9 L+ s( x* M- {- E其他也沒有好說的了,要注意的是,採集的時候,一個鏈接採集了一次要隔一段時間再去採集,太頻繁了會被封一會。2 P X7 X) ?- q0 \, W" x
& Z/ O6 W# {5 U: {9 s
3 C, d1 t$ k3 b8 k$ m0 G5 h說下為什麼沒有做全自動的每天自動採集:
; M0 L: o4 m, g6 v% X# n: r @1.因為我本人不提倡和不喜歡採集
; T3 G" y! @% r6 u3 o( i2.RSS更新很慢,每天手工點一下,這樣也有助於你收錄,因為搜索引擎不喜歡大量的搜錄,如果你每天或隔幾天才多出少許的新文章,這樣的站搜索引擎才不會認為你再採集。/ g o. p! q$ l1 z& G
3.這個軟件第一版我看下反響,再考慮以後的版本功能,要是反應不好我就不做了。
6 y, Z8 S) t% Q8 @ M0 J4.假如有超強的全功能版本,我會收取少量費用,第一版就免費了,功能還是蠻不錯的。
, F# t; U' _9 t6 ]- f
& w; D: x) m0 a' Y
$ t8 j4 V* U$ D# a: d# G軟件的安裝:, v9 V. D6 [3 v/ P$ K, {1 A J4 ^
1 ]) K. E# k" X( v; A8 z
1.上傳 月光RSS採集插件 hyrinlight_gather_rss.php 到你的wordpress插件目錄
' A9 k! c9 c& ?8 ~* [/ K: b
7 F2 ^$ [4 x: {8 \2.打開助手,添加插件準確位置,保存。8 k. D4 y9 _7 b/ O8 Y: d; p
U9 W6 e" H& z8 D3.添加新的RSS鏈接,並設置採集節點。- ]3 ]) L; B' ]/ y8 }0 E4 t
4 g' K; Y6 N) ^- z" v9 r7 O, F
4.開始採集並檢查結果。, a* r. _' c; K
6 Z0 w, ~/ x7 C/ E
1 U" B7 @* U; d+ T r9 t
/ q0 I2 f+ h2 l/ G, j3 G) D
2 I: u, H: D( R- D' d/ c% Z! Z. F; y$ ~
, L& v/ I3 G- [: g! O" `最後附截圖 |
評分
-
查看全部評分
|