合法有效的HTML代碼) d; o! J9 z' v
許多網站設計者最常犯的錯誤便是當其網頁能夠在IE下正常顯示便認為其代碼正確無誤,甚至常看到有人在抱怨其網站排名不理想,到其網站簡單看一下便可發現HTML代碼中充斥各種各樣的錯誤,在那樣的代碼基礎上無論付出多少努力去優化網站結果都可能是付諸流水的啊!
3 Q( u" ^2 V* P% q$ A! a& P$ ?
8 V1 J( J4 ^6 a5 ^) G8 G4 Y 事實上,IE是一款對HTML代碼容錯能力甚高的的瀏覽器,——說句題外話,儘管我們可以有各式各樣的理由可以攻擊微軟,但微軟對其產品操作的易手性及可用性方面所做的努力是不容抹殺的。——Web頁面能夠在IE下正常顯示絕不意味著頁面的HTML代碼沒有問題,甚至可以推而廣之,Web頁面在多種瀏覽器下均可正常顯示也不意味著HTML代碼完全合法有效,畢竟哪個瀏覽器都要保證基本的容錯的功能,不然,就會發生即使僅僅因為網絡傳輸中的一點導致導致HTML頁面顯示不正常了,而這在網絡帶寬仍然緊張的今天仍是頻繁發生的。(媒體)
- C6 S0 d) G) z. l; r: i! u+ d3 ?
什麼是合法有效的HTML代碼
1 x3 b4 ` U7 W$ q 簡單說來,我們的Web頁面是由HTML(Hypertext Markup Language : 超文本鏈接標示語言)元素構成的,即使對於ASP、PHP之類的動態頁面,其也是由SERVER將ASP或PHP語句渲染成相應的HTML元素並下傳到客戶機上;對於JavaScript之類則由客戶端將其轉換為HTML。) l0 d, g, r# H
T3 ]+ s b. I. o 同其他語言一樣,HTML也有自己的語法規則,無論是瀏覽器還是搜索引擎的Spider都在根據這些規則來分析網頁代碼中的內容。但很多時候,即使對熟練人員來說,在HTML頁面構建時仍然難免出些HTML代碼上的錯誤,更別提大部分所見即所得編輯器造成的HTML冗余臃腫問題了。
8 y& ?. o# D5 a7 k" D5 b3 B6 J5 V) B# L8 Q4 J1 _; D
如果頁面中不存在違背HTML標準語法規範的成分,即可被稱為合法有效的HTML代碼& Z/ O4 X$ L0 J+ ~8 Q5 O1 b
' k c5 B8 [' h& j7 t2 \+ F( E. J
合法有效的HTML代碼對SEO的重要性
, K4 X. @: ]( Z) ]1 Y% ^8 A 要使搜索引擎收錄我們的網頁,——在此基礎上才能談網站優化網站推廣——其前提是要讓搜索引擎的Spider能讀懂我們的Web文件。搜索引擎Spider閱讀網頁的根據便是HTML規範,通過對HTML代碼的分析,Spider才能判斷網頁內容,在此基礎上才能判斷針對相應關鍵詞的相關性。
5 l( C* t x, A9 }7 g! r% I1 y; s2 Y( \' e2 ~$ U+ h) _- m
需要明確的是,搜索引擎Spider不同於瀏覽器的一點便是其容錯能力相對於瀏覽器要差不少,如果頁面代碼中存在其無法解釋的HTML代碼時,其便可能停止閱讀該頁面甚至可能停止在我們的網站內爬行,更嚴重的錯誤甚至會導致其同時也丟棄已經收集到的網站內其他頁面的內容信息。( g, q* i, F {! b7 U, G3 q0 L
4 u* M- Q- m# k+ G0 M& r
儘管如今如大主要搜索引擎也都在盡力提高Spider的容錯能力,讓其可以在HTML代碼出現一般性錯誤時不至影響對內容的收集。但很多時候,仍然會發生如漏了一個關閉標籤導致整個頁面的內容被忽略的情況。
# c# W! K3 ^9 ^0 a: j
( h! M2 x8 _8 @/ t; K 另一方面,合法有效的HTML也可以保證Web頁面可以在多種瀏覽器下被正確解釋,避免同一個頁面在IE下顯示正常在Mozilla下卻嚴重變形的情況(當然,不能完全避免),這對於提高網站的可用性方面也是有著極大好處的。- M# d/ w/ \' J( ^% L& g
% ]; m2 B; `& a% d
如何驗證HTML代碼的合法有效?1 j% ]- t' A: O" n" |
Internet有很多類似的免費服務可以幫我們驗證網頁代碼是否合法有效,其中最著名的即是 W3C HTML Validator ,這是由W3C( World Wide Web Consortium:萬維網聯盟)官方推出的免費服務項目,在其頁面上只需輸入待驗證的HTML地址或者上傳一個在本地機上的HTML文件即可,其會很快返回校驗結果,是否無誤,如有錯誤分別為哪些及如何改進等。
2 l% N/ B T; L
6 K5 ^' ^ _+ G 同時,W3C HTML Validator也提供對CSS文件的驗證服務。
; A+ x9 P# {9 U+ y9 g0 i/ w6 W9 S+ O- u: ]- U' Z) L" I$ Z1 C, n
一定要通過W3C的驗證麼?
) q9 q5 s/ |1 A# D: I7 U7 P+ M 對這個問題的答案則不那麼絕對。
! B: ~; I7 D* n( f! o) `5 u9 l* i' d7 L- a) l
理論上說,合法的HTML代碼能夠使搜索引擎的Spider在更容易地收集網站頁面的內容信息。但另一方面,並不是所有的HTML代碼錯誤都會影響到Spider的爬行,也即是說,HTML存在少量的錯誤對Spider來說也是可接受的,那麼,一定要通過W3C認證麼?9 G$ ~; l- m4 E, Y
! [4 Z6 w8 P: l1 k, b3 _ 另一方面,如在Mark Daoust的測試中,甚至暗喻(未肯定地下結論)存在少量HTML代碼錯誤在頁面在Google排名中能更佔優勢,當然這存在很大爭議,但至少證明了存在少量HTML代碼錯誤並不影響網頁在SERP中的排名。
7 c# S% U* R$ {1 Q
5 u3 Y9 h) D$ l: @ J- G 個人觀點,如果您對HTML相對不那麼熟悉的話,倒也不必強求非得100%通過W3C的驗證,畢竟把更多的時間與精力放到真正應該努力的方向如創建內容與鏈接才是根本,但要保證HTML代碼中不存在大的嚴重性錯誤。當然,如果您對HTML語言較為精通,那麼,何妨稍花點功夫以確保其完全無誤呢?正如在上篇文章中所說的:% x3 U% v% |2 g) ]) D
- s7 D: Z2 ^0 T, W0 U6 s3 T
因此,我們要做的倒不一定非得通過W3C認證,但至少要保證其在各種瀏覽器下顯示正常,保證搜索引擎的Spider能夠正常分析。2 j$ x3 A9 U) c
0 K9 U0 z' w% s% m6 D提高HTML代碼的效率" ~) D `0 l+ r. X% `; {
前文我們提說過很多所見即所得編輯器造成的HTML冗余臃腫問題,這種情況在很多中文網站相當普遍。所見即所得編輯器如FrontPage、Dreamweaver,尤其在其對一個網頁進行修改的時候,往往會產生很多不必要的冗余代碼。當頁面的HTML文件在存在大量的冗余代碼時,文件便會變得臃腫,這不但會降低網頁的打開速度,損害到網頁的效率,同時也會嚴重影響到相當網頁的搜索引擎排名。, b% I. g J' f7 l; Q5 w) i
) t. R6 A+ Q; W& E& T2 I( [: }; W
與其把精力投入到一定通過W3C認證上,個人認為,倒不如把更多的精力放到精減代碼上,如引入CSS等,以實現代碼的乾淨簡潔。這樣的優化效果會更明顯。
" Z, n0 [* H) K. A# P) V1 ^- ~+ F4 J. {+ h; R/ G$ q
《合法有效的HTML代碼》結束!
3 f7 N+ k. r; a; f5 o1 a& C+ e+ O6 Y& Z( P- }4 C% n
! X% F/ c5 {0 f% p+ {在合法有效的HTML代碼一文中,我們談到過所見即所得編輯器造成的HTML冗余臃腫問題:所見即所得編輯器如FrontPage、Dreamweaver,可以幫助我們簡便快速地創作或編輯HTML頁面,但在生成「乾淨的」HTML代碼方面則是個弱項,尤其在其對一個網頁進行修改的時候,往往會產生很多不必要的冗余代碼。當頁面的HTML文件在存在大量的冗余代碼時,文件便會變得臃腫,這不但會降低網頁的打開速度,損害到網頁的效率,同時也會嚴重影響到相當網頁的搜索引擎排名。, _9 O3 C$ \% X! I
# [3 O% ~% w) f' }( ^9 C盡可能使用最精簡的HTML代碼. H# {. p* U' D0 s& r+ n
要提高頁面的下載速度,降低服務器帶寬的壓力,需要我們盡可能地縮小頁面文件的「體積」,當然,這不能以減少頁面中具體內容為代價,也即是說應該在保證頁面可視部分不變的前提下,盡可能使用精簡的代碼,減小頁面HTML文件的字節數。
: U' ^5 s/ r& X' S6 i- B" L. ^' A- o$ {+ h6 y+ P" M" |0 F
事實上,在HTML中同一效果的實現可以有多種不同的解決辦法。比如說,如果我們需要在頁面中顯示「粗體」字,至少有兩種方式可以實現:<strong> 標籤或 <b> 標籤,很顯然,使用 <strong> 標籤要比使用 <b> 標籤多了5個字符,而如果考慮到HTML標籤必須成對出現的語法,相應的 <strong></strong> 標籤要比 <b></b> 多了10個字符。雖然某些HTML組織推薦使用<strong>標籤,但事實上,二者毫無區別,無論在頁面顯示還是SEO方面,那麼,為何不用效率更高的方式?
' g" y2 U1 K7 }( \' w5 q0 n- A9 R" e
6 z1 ?' B: [4 a盡可能避免冗余的嵌套標籤
& |) j" _' l: K. B3 J HTML代碼一個顯著的特徵便是其支持代碼的嵌套。但由此而來的另一個問題便是,所見即所得編輯器在修改某個格式時並不會將原格式刪除,而只是簡單地在原代碼中置入新的嵌套標籤,這樣不可避免地使HTML代碼變得臃腫。所以,要注意頁面HTML文件中冗余的嵌套代碼。% N x$ E& v" P$ a; R
, ]7 I" e; v3 Y6 m
比如說下文的代碼:
2 |. d; j+ U* i0 @& ?1 C- c; W2 \
<font face="細明體">這是</font>
8 v& @) C4 X: G. X8 }5 k2 m<font face="細明體"><strong>粗體</strong></font>3 P% C1 B, b- E2 D; Y0 R6 k8 f: g
<font face="細明體">示例</font> 0 D: [9 V4 m6 D2 O4 e
+ v7 m) Y, v/ ~+ U" T. y+ f: ? 這在使用所見即所得編輯器創作的網頁中是極其常見的,大家可以看出這類代碼的拙劣:<font>標籤不斷地在重複定義。類似上文的例子我們可以更有效地修改為:* s2 d' [4 P- _/ J; \
$ [& p% W! B* B& n( z# Z$ L<font face="細明體>這是<b>粗體</b>示例</font>4 ?& A/ N6 B# E; q+ k% I
3 [+ I- k; g g% V 可以看出相應的代碼減少了將近一半左右。5 N/ a9 X+ I* E7 d6 W p. Y
$ H% f0 r+ i# ]# j, D) C& E `盡量使用CSS
9 y0 o X. e0 J 傳統上,當我們在HTML頁面中定義相應的格式時需使用如字體(<font>)、段落(<p>)標籤,在這些標籤之間是我們的內容部分,如文本、鏈接、圖像等。當使用所見即所得編輯器修改某一格式時,相應的新標籤便會被放入頁面的HTML文件中,這樣,就會產生很多重複的代碼。隨Web技術的發展,現在我們可以通過定義樣式表(CSS: Cascading Style Sheets)來實現,這樣可以增強代碼的復用,提高效率。2 U% ^: l, O8 P6 z
% V. Z- w7 y0 u6 g5 R1 l7 t 同時,CSS也可以帶來其他好處,如可以作為外部文件引用,這樣,會大大降低HTML頁面文件的大小;而當我們需要對頁面的某些格式調整時,不必一個個去改動每個頁面,只需調整CSS文件即可,等等。
2 C1 d, J' _4 q- h8 `; G* I( T+ J+ G B6 H4 r
& I. d. E: K$ R+ X* Z
總之,代碼也影響排名!如果你排名長期上不去,請你檢查下代碼問題,自身網站的問題,等等! |
|