过期域名预定抢注

 找回密碼
 免费注册

wordpress做的採集站怎麼解決文章重複?

  [複製鏈接]
發表於 2013-6-19 19:55:45 | 顯示全部樓層 |閱讀模式
有的標題重複,有的標題內容均重複,試了好幾個插件和sql都不行!數據量大了的關係 ,非常慢的。
& m. @9 q# u9 k4 T* b, k( ?
發表於 2013-6-19 19:58:04 | 顯示全部樓層
這個需要技術支持,沒技術還是不要做採集站8 }* I7 R; N7 L( M$ M! }3 Z
sql使用模糊搜索語句like%%
7 y, @" y" Y, V9 Y! i

點評

主要这个站是架设在云上的,本身有很多限制,现在数据量大了操作数据库很容易到上限。。。这就是为什么现有的插件和sql查询删除语句行不通的原因。 换个思路,如果不好去除重复,如何做优化利于seo呢? 我是在google  詳情 回復 發表於 2013-6-19 20:26
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2013-6-19 20:26:22 | 顯示全部樓層
月光飛燕 發表於 2013-6-19 19:58 , U% S, L( K6 i' k2 l( Q, B
這個需要技術支持,沒技術還是不要做採集站6 W- h% Q; A, S) n2 _( u( y
sql使用模糊搜索語句like%%

2 r( B( Q3 C( W+ ?主要這個站是架設在雲上的,本身有很多限制,現在數據量大了操作數據庫很容易到上限。。。這就是為什麼現有的插件和sql查詢刪除語句行不通的原因。$ c) K. |. U3 _
換個思路,如果不好去除重複,如何做優化利於seo呢? 我是在google站長工具裡看到重複數據的提示才發現問題的!. s7 N7 i0 S& e# Z$ \0 N
- }; Y9 o0 m1 n9 @4 L' b  [

0 R8 N) x# L$ |2 w/ V% c

點評

重复必须去除,否则不利于seo,建议使用独立的vps  發表於 2013-6-21 17:50
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-19 20:30:27 | 顯示全部樓層
有插件,你百度找下。6 ?9 V$ U7 f1 D7 a% _
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-19 21:28:30 | 顯示全部樓層
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複,自己寫存儲過程和函數,最後插入wordpress的相關表裡面。還有定時發佈,我沒有使用任何定時發佈的插件,直接生成所需的發佈時間。
! }- e2 N* r# f' s7 l9 D4 }

點評

请教如何用sql分拆? 我是select数据后用php进行处理的,用sql会效率高些? 求指点  詳情 回復 發表於 2013-6-20 06:54
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 06:52:56 | 顯示全部樓層
cyrich 發表於 2013-6-19 21:28
0 K$ }- E4 {8 d+ z6 h- x/ h通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複, ...
7 w$ Q1 o% m, u- ~* ~" ~) J
都通過sql啊, 這個也太麻煩了吧......* \" o! q2 X) e: E# m5 y3 a! t
為什麼不使用php啊? 你要是有些變量需要修改,不就得修改存儲過程了?
0 c3 [) @4 x" S
3 L& M8 p. u; R% i$ _  R# d' l% V' R8 t7 |6 p- f" W& m4 _
) `# H% l# z) q

點評

我不会PHP  發表於 2013-6-20 13:09
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 06:54:21 | 顯示全部樓層
cyrich 發表於 2013-6-19 21:28 ; K9 ~( h7 N1 z" k
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複, ...

/ K: f$ l8 ~4 M) q- Q$ H. E; _& J請教如何用sql分拆?4 P: G0 Q0 ?! N0 s0 n; q
# k1 z, d$ V7 {, U: |
我是select數據後用php進行處理的,用sql會效率高些?' o, w5 i+ Z( |  P( E5 k8 W

+ L" X. L! I$ q+ h0 V求指點
8 M6 f( f. f5 F
9 J" [/ v. ]9 s! r- O( j+ u5 R; ~3 R9 u6 s$ w( V

點評

只会SQL语言,没学过PHP,所以一般使用SQL来编缉数据,必要时就写个存储过程和函数  詳情 回復 發表於 2013-6-20 13:11
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:11:28 | 顯示全部樓層
風吹不動 發表於 2013-6-20 06:54
' y6 t+ b  M$ O$ h* K2 j請教如何用sql分拆?8 q( Y  |$ j3 I9 ~( i2 ?

6 R& A- J% A7 B0 ?我是select數據後用php進行處理的,用sql會效率高些?

# `& k) Y+ L. i" B5 O" }只會SQL語言,沒學過PHP,所以一般使用SQL來編緝數據,必要時就寫個存儲過程和函數
  F7 X0 A5 c; Y, Z/ V. w2 K9 _- ^- f- Y% @+ v& K. {- O' d  q
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:20:03 | 顯示全部樓層
http://blog.csdn.net/dengwen168/article/details/88327759 D& C! C2 q  O7 D' u; o' C" \) q
用火車頭採集和發佈比較簡單.
, [" D5 [8 i' j' K! o% D
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:37:35 | 顯示全部樓層
如果要防止完全重複,給title字段加上Unique索引,不過這樣wordpress使用的時候會有一些問題 比如無法自動保存。 或者你另建一個key-value索引表只留ID和TITLE兩個字段 然後用它對應wp_posts去重9 N3 G& R  z+ }

點評

谢谢!!!!!!!!!!!!  詳情 回復 發表於 2013-6-20 19:51

評分

參與人數 1點點 +2 收起 理由
月光飞燕 + 2

查看全部評分

回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

4um點基跨境網編創業社區

GMT+8, 2024-11-26 06:31

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表