过期域名预定抢注

 找回密碼
 免费注册

wordpress做的採集站怎麼解決文章重複?

  [複製鏈接]
發表於 2013-6-19 19:55:45 | 顯示全部樓層 |閱讀模式
有的標題重複,有的標題內容均重複,試了好幾個插件和sql都不行!數據量大了的關係 ,非常慢的。/ M" K. T4 p2 ~# L  q5 g9 z
發表於 2013-6-19 19:58:04 | 顯示全部樓層
這個需要技術支持,沒技術還是不要做採集站
7 b! O( m( ?7 T* T! S' s: s% lsql使用模糊搜索語句like%%
7 n1 F8 r8 X! W1 h

點評

主要这个站是架设在云上的,本身有很多限制,现在数据量大了操作数据库很容易到上限。。。这就是为什么现有的插件和sql查询删除语句行不通的原因。 换个思路,如果不好去除重复,如何做优化利于seo呢? 我是在google  詳情 回復 發表於 2013-6-19 20:26
回復 给力 爆菊

使用道具 舉報

 樓主| 發表於 2013-6-19 20:26:22 | 顯示全部樓層
月光飛燕 發表於 2013-6-19 19:58 2 K# K  I. X0 J4 R
這個需要技術支持,沒技術還是不要做採集站* e+ W# P  p" {, C
sql使用模糊搜索語句like%%
8 ^9 k! R/ U% x) S+ e; m
主要這個站是架設在雲上的,本身有很多限制,現在數據量大了操作數據庫很容易到上限。。。這就是為什麼現有的插件和sql查詢刪除語句行不通的原因。
: H9 x& [8 q+ L! S! |  ]換個思路,如果不好去除重複,如何做優化利於seo呢? 我是在google站長工具裡看到重複數據的提示才發現問題的!" Q. J) z9 [" Q
$ j& W1 g4 t; W# e( N0 V/ N

7 n. A( v6 v2 A6 Y' L

點評

重复必须去除,否则不利于seo,建议使用独立的vps  發表於 2013-6-21 17:50
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-19 20:30:27 | 顯示全部樓層
有插件,你百度找下。
# `& f+ `2 T3 ?( h% R0 ^
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-19 21:28:30 | 顯示全部樓層
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複,自己寫存儲過程和函數,最後插入wordpress的相關表裡面。還有定時發佈,我沒有使用任何定時發佈的插件,直接生成所需的發佈時間。4 S7 G; P. u1 W2 u; p  t5 D" _

點評

请教如何用sql分拆? 我是select数据后用php进行处理的,用sql会效率高些? 求指点  詳情 回復 發表於 2013-6-20 06:54
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 06:52:56 | 顯示全部樓層
cyrich 發表於 2013-6-19 21:28 ' E8 p; U! P' |8 F: V
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複, ...
# \. X4 f" R, U) ?& b+ h' Z
都通過sql啊, 這個也太麻煩了吧......
2 o7 t' {1 z0 O$ T8 A為什麼不使用php啊? 你要是有些變量需要修改,不就得修改存儲過程了?  Y- M5 O7 P- S* D
% D" m5 M4 p5 ~" A* N5 g

+ H. ]' I# t3 R8 n$ n) e7 v  S8 \% L% Y. c- I

點評

我不会PHP  發表於 2013-6-20 13:09
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 06:54:21 | 顯示全部樓層
cyrich 發表於 2013-6-19 21:28 % v$ q' a3 P) x$ w5 u- J9 u- q
通常採集回來的內容,我都是通過SQL分拆、拼接、變換內容、變換標題等等,還有去標題、關鍵詞、標籤重複, ...
* S3 P4 ~' y, q9 D# {
請教如何用sql分拆?$ S7 A7 f& z6 |: J0 I# H

# |% w5 C5 R! u8 d7 B/ l% P2 z1 `我是select數據後用php進行處理的,用sql會效率高些?: z, k- p. I: v+ f6 D1 q+ S
, Y2 }9 _, s0 `  B
求指點
( b1 C5 p* B3 q+ n( E9 ?' J" s3 K8 C' x
' p! F  J7 X, G- M) ?4 I) s

點評

只会SQL语言,没学过PHP,所以一般使用SQL来编缉数据,必要时就写个存储过程和函数  詳情 回復 發表於 2013-6-20 13:11
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:11:28 | 顯示全部樓層
風吹不動 發表於 2013-6-20 06:54 4 y4 z, F- @4 k5 P/ |4 l
請教如何用sql分拆?
. _% r- n, _  o( N$ P2 {* H
: G  F) E( O4 k我是select數據後用php進行處理的,用sql會效率高些?
  g2 T" i% E  O* ^
只會SQL語言,沒學過PHP,所以一般使用SQL來編緝數據,必要時就寫個存儲過程和函數
* e4 y1 S( C; z& V; g
) @. j3 z" S6 y
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:20:03 | 顯示全部樓層
http://blog.csdn.net/dengwen168/article/details/8832775
& g# x  e* e( `, k! {, m5 u6 U0 |用火車頭採集和發佈比較簡單.$ d- R1 r  c4 N' R* t; H
回復 给力 爆菊

使用道具 舉報

發表於 2013-6-20 13:37:35 | 顯示全部樓層
如果要防止完全重複,給title字段加上Unique索引,不過這樣wordpress使用的時候會有一些問題 比如無法自動保存。 或者你另建一個key-value索引表只留ID和TITLE兩個字段 然後用它對應wp_posts去重
* m0 J7 O! u  _

點評

谢谢!!!!!!!!!!!!  詳情 回復 發表於 2013-6-20 19:51

評分

參與人數 1點點 +2 收起 理由
月光飞燕 + 2

查看全部評分

回復 给力 爆菊

使用道具 舉報

您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

4um點基跨境網編創業社區

GMT+8, 2024-11-26 06:46

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表