过期域名预定抢注

 找回密碼
 免费注册

wordpress做的採集站怎麼解決文章重複?

  [複製鏈接]
發表於 2013-6-19 19:55:45 | 顯示全部樓層 |閱讀模式
有的標題重複,有的標題內容均重複,試了好幾個插件和sql都不行!數據量大了的關係 ,非常慢的。
+ {; I) g" a) S# K# n3 Q+ n
發表於 2013-6-19 19:58:04 | 顯示全部樓層
這個需要技術支持,沒技術還是不要做採集站* l4 o& T( G  s2 j& E6 ~- P
sql使用模糊搜索語句like%%
& y: G. }5 b) Z) N+ P

點評

主要这个站是架设在云上的,本身有很多限制,现在数据量大了操作数据库很容易到上限。。。这就是为什么现有的插件和sql查询删除语句行不通的原因。 换个思路,如果不好去除重复,如何做优化利于seo呢? 我是在google  詳情 回復 發表於 2013-6-19 20:26
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2013-6-19 20:26:22 | 顯示全部樓層
月光飛燕 發表於 2013-6-19 19:58
- a" K9 ~* U/ h這個需要技術支持,沒技術還是不要做採集站: Z9 Q) u+ S$ j  L6 E
sql使用模糊搜索語句like%%

, A* @, M5 ^  V* [主要這個站是架設在雲上的,本身有很多限制,現在數據量大了操作數據庫很容易到上限。。。這就是為什麼現有的插件和sql查詢刪除語句行不通的原因。
. c% |$ f& i9 n8 ?! E換個思路,如果不好去除重複,如何做優化利於seo呢? 我是在google站長工具裡看到重複數據的提示才發現問題的!
0 }" y4 ?/ R: Z+ m4 K& n0 J) m, c: I1 L

- r8 W" E$ x% H' h- d0 b# R

點評

重复必须去除,否则不利于seo,建议使用独立的vps  發表於 2013-6-21 17:50
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-19 20:30:27 | 顯示全部樓層
有插件,你百度找下。
% y, g' _$ m% ^" N) R+ r
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-19 21:28:30 | 顯示全部樓層
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複,自己寫存儲過程和函數,最後插入wordpress的相關表裡面。還有定時發佈,我沒有使用任何定時發佈的插件,直接生成所需的發佈時間。3 x7 r* {) g) n- f0 I. b4 r. |+ }

點評

请教如何用sql分拆? 我是select数据后用php进行处理的,用sql会效率高些? 求指点  詳情 回復 發表於 2013-6-20 06:54
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 06:52:56 | 顯示全部樓層
cyrich 發表於 2013-6-19 21:28 % X( m& v+ y8 h3 S
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複, ...
8 ~- H* A6 O. Q& v1 N8 ^: U
都通過sql啊, 這個也太麻煩了吧......- w. @$ ^% ~' @8 E
為什麼不使用php啊? 你要是有些變量需要修改,不就得修改存儲過程了?
; J& X3 b2 T& K9 g/ O4 ?( i3 S- o' |
" g3 d) n# J. h$ ?9 T* e# B
. {% ?6 ^1 u- c' ]  x6 I

點評

我不会PHP  發表於 2013-6-20 13:09
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 06:54:21 | 顯示全部樓層
cyrich 發表於 2013-6-19 21:28
9 M' j2 q+ D) T  d  `" X5 \通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複, ...

: l8 J0 H# i% I2 v6 e2 g; R請教如何用sql分拆?
! s$ B) B/ x8 e4 e7 c/ B
( E5 ?% c1 J; d% |, ^1 t- R我是select數據後用php進行處理的,用sql會效率高些?) g! p+ L/ M* r4 C+ d9 n
1 O. R" K" ~" }; A- R* `# P& r5 F
求指點! w4 `) G  Z0 g, N# W
- x7 I8 g5 |( R: W( Z

# L6 l) _  e+ M; l  I+ m

點評

只会SQL语言,没学过PHP,所以一般使用SQL来编缉数据,必要时就写个存储过程和函数  詳情 回復 發表於 2013-6-20 13:11
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:11:28 | 顯示全部樓層
風吹不動 發表於 2013-6-20 06:54
0 ~$ S) O4 B. R) ~5 m$ ~請教如何用sql分拆?
- R* |# d+ ?" c, V* V& V
; T1 G$ |/ `. g( l  h& [我是select數據後用php進行處理的,用sql會效率高些?
8 I5 p) U8 {9 T
只會SQL語言,沒學過PHP,所以一般使用SQL來編緝數據,必要時就寫個存儲過程和函數0 E4 l( l, i, z
! I2 C. w6 E! P: o; c
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:20:03 | 顯示全部樓層
http://blog.csdn.net/dengwen168/article/details/8832775, x1 C, V. q' y3 ~
用火車頭採集和發佈比較簡單.
+ _" p+ d+ E  q
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:37:35 | 顯示全部樓層
如果要防止完全重複,給title字段加上Unique索引,不過這樣wordpress使用的時候會有一些問題 比如無法自動保存。 或者你另建一個key-value索引表只留ID和TITLE兩個字段 然後用它對應wp_posts去重" I' ?# t% Z7 F9 N

點評

谢谢!!!!!!!!!!!!  詳情 回復 發表於 2013-6-20 19:51

評分

參與人數 1點點 +2 收起 理由
月光飞燕 + 2

查看全部評分

回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

4um點基跨境網編創業社區

GMT+8, 2024-11-26 04:45

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表