过期域名预定抢注

 找回密碼
 免费注册

百度「反垃圾網站」的若干問答

[複製鏈接]
發表於 2006-8-9 21:48:07 | 顯示全部樓層 |閱讀模式
按摩z:1:百度降權,封殺站點的標準是什麼: O4 c  u1 T4 V0 ]% }: T) I

: q; V6 E' o! ]7 c& I9238:4 l1 R3 [- F" d( G
第一,
http://www.baidu.com/search/spam.html 是百度公開和唯一的標準,百度的反spam一直依此處理。就像所有其它搜索引擎一樣,百度不能公開所有反spam細節,已公開的部分已經是搜索引擎中算很透明的了。0 e4 k. a" R6 X5 u2 q3 W
( w( ^# j: _% F9 Y( T6 [% v
第二,在百度搜索引擎中對某些站點降權或去除的目的主要是反spam(或者叫反垃圾),反spam的唯一目的是提高用戶搜索體驗。百度反spam對所有網站一視同仁,不會因為任何網站是百度的客戶或合作夥伴而降低懲罰標準,也不會因為任何網站與競爭對手合作或停止與百度的合作而加重懲罰。在百度中,有權限參與網站降權處理的只有了了幾人,他們每一個都是極端的搜索愛好者,他們也有完全的自主權和獨立性,不用關心處理哪個網站會影響流量或收入,不用給任何部門、任何同事或任何網站面子,他們唯一關心的是用戶搜索體驗。
" Z! ^- O% Z: Z. P8 y& c! {. L4 l6 D5 H
第三,搜索引擎優化行為對用戶體驗的破壞程度是線性分佈的,百度反spam是機器自動識別和人工識別互補的體系。既然有識別就有判斷的閾值,無論是自動識別還是人工識別,無論把閾值定在哪裡,那些閾值附近的優化行為判斷總是容易引起爭議的。在所有支持中文的搜索引擎中,百度也許已經是反spam做得最努力的,但中國網民在百度的搜索體驗仍然每天被spam嚴重破壞1500萬次以上(spam網頁出現在搜索結果前10名)。因為中文spam面廣量多,因為百度反spam打擊也面廣量多,即使閾值附近的爭議網址只佔很少的幾個百分點,也可能導致每天有幾十個網站有資格對於被懲罰表示異議,這不是百度願意看到的,但現實點說,無法指望短時間內大幅度減少這種問題,也無法指望能人工一一回復每個提出異議的網站。- F. N( J0 ]% K; v
) @' S! z6 b1 l  x# i
另外,對於加入百度搜索聯盟並且達到一定搜索量的網站,我們有一個優待政策:在發現自己被降權後可以申請立即複查一次,如果複查發現網站上已沒有spam 行為,則可以安排盡快取消降權。但這個權利只能用一次,一旦該網站在例行檢查、網友舉報、或不定期複查中被再次發現spam,那麼無論誰也救不了它了。/ e6 f9 x0 v2 O+ ]/ l
6 p4 |" P% a1 |, ?/ N
按摩z:hao123的發展思路是什麼?第一,如果想加入新站點,目前是什麼政策?據說收費了?費率多少?第二,以前被收錄的站點會不會有政策處理上的變化?這是他們很關心的問題。
% ?% g( L4 d2 y- d8 n
! x) g6 \5 ?  p" s9238:5 _0 E# w' `  j7 O/ d$ {
詳細的發展思路是商業機密,我不能在此公開。但可以回答你一個具體的問題,所謂hao123已改為收費登錄那是假的,每個頻道只是賣少量廣告(百度對廣告的控制極嚴,沒有在hao123原有基礎上增加任何flash或banner,每個頻道廣告鏈接原則上不超過5個,不達到一定質量要求的網站即使廣告也不賣給它,負責hao123用戶體驗的員工對廣告有一票否決權),但現在肯定沒有全面收費,今後的一段時間內也沒有這個打算。以前被收錄的站點不會有處理策略的變化,hao123的用戶體驗或者被收錄網站的質量是挑選和更新的唯一標準。
! _: W; J" a) M7 |. x; o' B
, l0 m2 f/ }& e# q* L7 a5 @% P按摩z:百度mp3搜索的策略與mp3音樂站長群的矛盾如何化解/ O8 s" {" W, f7 _1 |( W0 b# R

; p6 E* c; R5 m) {# h* a9238:  r% J: A% u7 @3 u$ N2 J/ t
迄今為止百度的mp3信息幾乎都是從百度的網頁庫中提取出來的,而百度的spider一直遵守國際通行的robots協議,不願意被百度收錄mp3信息的站長只要寫一句robots協議就能阻止百度spider再收集信息(以前收集的信息需要等一段時間被更新後才消失),在百度的用戶幫助信息中提供了詳細的robots協議寫作教程:
http://www.baidu.com/search/robots.html' B& q9 I3 n3 I' T0 g
/ e9 p7 F, E6 w6 C: }/ D
按摩z:不知道百度對故意重複的定義是什麼,比如donews首頁的標題,有大量的IT重複出現,是否算做故意重複呢?又比如前幾天突然被降權的 9flash.com。他在頁面裡所重複的「flash」關鍵詞,是不是屬於「故意」面向搜索引擎做的呢?我們可以這麼測試一下,把「flash電影」和 「電影」兩個詞比較,可以等同嗎?不等同說明flash這個詞在這裡,是必要修飾詞,把「flash音樂」和「音樂」兩個詞比較,可以等同嗎?不等同說明 flash這個詞在這裡,是個必要的修飾詞,下面的不用解釋了,我覺得這個其實很容易理解,如果在對方站點裡出現的某些關鍵詞在該站點的內容和連接表述中,屬於必要修飾詞,並且該關鍵詞所出現的段落和連接有其正確的表述價值,那麼這種重複,就不能說是「故意重複」,我不知道百度認同否?* H  W2 b$ c( |" d( y2 s" _
! o* c6 h/ ~  _# P  L7 I& \
9238:$ \! g0 {1 t" n% A: i; V: s! q
反spam的唯一目的是提高用戶搜索體驗。我們不會為了反spam而反spam,不會對所有違反規則的網站施加相同的懲罰,關鍵在於,用戶查看某個關鍵詞的搜索結果時,你的網站對用戶是否有價值、這個價值所否值得你排在那個位置?
; H5 ?; I8 J: x* n: i) z1 S9 C即使donews對IT重複了,如果在IT這個關鍵詞的搜索結果中沒有排在非常不該排的位置,沒有對用戶搜索體驗造成明顯破壞,那麼理想狀態下 donews仍不會受懲罰。9flash如果只對flash關鍵詞優化,那麼不太容易受到懲罰,但如果對電影關鍵詞優化,那麼很容易受到懲罰。
8 q8 G$ x8 K# E& X
6 W0 v* O8 t/ H. V明白的說,網站spam與否是網站的自由,百度無權干涉也沒興趣理睬,但如果哪個網站的行為或效果破壞了中國網民在百度搜索的體驗,那麼百度也有升級算法、降權、直至拒絕收錄這個網站的權利和興趣。其實各位站長完全沒必要把百度怎麼想當一回事,站長們只要把百度的搜索用戶當一回事就行了,只要你的網站對用戶有搜索價值,百度急著升級算法把你排到合適的位置都來不及呢,哪裡敢把你降權什麼的呢。/ ~! J, M" M. U- k

: n! ?# S4 w% f7 t  a按摩z: 故意製造大量鏈接指向某一網址的行為。: B/ ~2 j8 C7 n% x
我覺得這個條款簡直可以讓所有的站點納入EMU的範疇。) Y$ h8 z+ C$ ]9 O9 y. v2 r
百度有個聯盟,把代碼投放到千萬個站點上,算不算「故意製造大量連接指向某一網址」?這個是個玩笑,但是事實是,所有的站長,特別是那些沒有能力做大幅度廣告預算的個人站點,他們的網絡推廣途徑的重要步驟,就是和大量的不同站點交換連接,交換連接,不就是「故意製造大量鏈接指向某一網址的行為」嗎?這是其一。如果我做了一個站點,我又申請了blog,我又申請了donews,我又申請了什麼什麼,我又泡論壇,那麼我肯定會把我的站點連接放在每個我能放網絡連接的地方告訴大家,比如論壇簽名檔,比如blog的連接,比如donews個人介紹,等等,有沒有搜索引擎我都會這麼幹,站長怎麼發展流量?坐等嗎?這是其二。商業公司要發新聞稿,公關稿,網絡時代了,網絡媒體也很重視,一個稿子發新浪搜狐網易千龍天極等等等等,每個稿子上都會有這個公司的連接,又是故意製造大量連接指向同一網址。這是其三。請百度的朋友解釋一下,怎麼叫「不故意製造大量連接呢」,做好站點,放在那裡,等別人連接或者乾脆不要外部連接,也許只有國家政府機關的網站會這樣。
/ }4 q2 s0 I3 K* M1 Y1 T. L" ^
+ `) A; J. v0 a5 ?8 Z9238:上一個回答也能用在這裡吧?誰愛做鏈接就做吧,但別針對與自己網站內容不相關的關鍵詞做,即使相關的關鍵詞,也別排到特別不合適的位置去。其實,百度能自動過濾不少可疑鏈接,所以某些製造鏈接的行為根本不會受到懲罰,因為對排名不會有任何影響。
0 W4 w8 s, J4 z# l) Q. q0 f# v. {9 T- K0 g# V5 \! y  t
按摩z:有鏈接指向EMU網站的網站,負連帶責任,也會被認為是EMU6 z' J. n  m+ H2 F+ O( R
這個最狠,簡直是連坐,大清朝倒台後好像就不興這個了。不過互連網本身就是由大量的連接組成的,這個方式搞下去,恐怕是人人自危吧,我這麼說吧,A站EMU(證據確鑿,驗明正身),B站上不巧給A站做了連接,那麼B站被認為是EMU,那麼C站上偏偏也給B站做了連接,得,既然B站已經被認定也是EMU,道理同樣,C站指向EMU站點,也是EMU,D站又有C站連接,慘了,這麼連下去,和百度的Spider沒啥區別(相當於倒過來爬);洪桐縣裡沒好人,互聯網上沒好站,大家彼此彼此。8 I5 ~0 z# K6 J4 [+ R& j/ N
& ^' I; M  t& A" ]$ p9 r
其實百度真要這麼搞也可以,每天公佈一個封殺EMU站點列表,並給相關連接站點一天的取消連接的準備期,這樣站長們就會每天上來看誰是最新的倒霉蛋,看看在不在自己站點的友情連接裡,並且用最短的時間和對方劃清界限!消除連接,以免殃及自身不是。
3 U& w, c/ S" M+ A" t  c. \. k8 S8 v* |; E( e2 K* q. s
9238:) S* W4 @' X. b
這條規則,是針對某些擁有一大批域名互相鏈接EMU的人。從百度中降權或消失對於每個中文網站都是大事,我們不會輕易的批量懲罰的,事實上只有在對某些網站之間的關係相當有把握時才會激活這個懲罰規則,而且,雖然批量鏈接EMU是機器自動識別的,但識別出的每一個網站在被正式懲罰前都會經過人工驗證,幾乎不可能誤殺。
6 a6 W+ \  A. Y2 Q+ i3 U$ ?4 _! b- {* l7 b) a  y# u7 d- i9 b: \( w. e
普通的友情鏈接再多也不會受懲罰,但僅限鏈接所用文字是合適的網站名,如果用關鍵詞做鏈接,則很容易被識別為spam。
您需要登錄後才可以回帖 登錄 | 免费注册

本版積分規則

點基跨境 數位編輯創業論壇

GMT+8, 2025-4-6 02:09

By DZ X3.5

小黑屋

快速回復 返回頂部 返回列表