我們在做(zuò)網站結構相關SEO工作時(shí),都應該考慮以下(xià)三個(gè)問題:
1,Baiduspider能不能找到所有網頁
2,Baiduspider是否知道哪個(gè)網頁是重要的(de)
3,Baiduspider能否順利提取網頁内容
4,Baiduspider能否在網頁中提煉有用(yòng)信息
下(xià)面講的(de)内容便是解決前兩個(gè)問題的(de):
一,友好的(de)網站結構
1, 扁平or樹型:一說到網站結構,大(dà)家都會提到扁平結構和(hé)樹型結構,言必稱“結構扁平化(huà)”,這(zhè)些指的(de)是物(wù)理(lǐ)結構,即基于内容聚合的(de)目錄及文件位置決定的(de)結構。其實對(duì)于百度搜索引擎來(lái)說,隻要結構合理(lǐ)、有邏輯性、内容有規律可(kě)循都可(kě)以,都是友好的(de)。
2, 鏈接結構:相對(duì)于物(wù)理(lǐ)結構,就要說到邏輯結構:即通(tōng)過内部鏈接形成的(de)鏈接結構,邏輯結構才是搜索引擎最關注的(de)。對(duì)于一個(gè)網站來(lái)說,網頁僅僅可(kě)以通(tōng)過首頁——目錄1——目錄2一層一層follow到是遠(yuǎn)遠(yuǎn)不夠的(de),一個(gè)優秀的(de)鏈接結構應該是網狀的(de)。
1)首頁鏈接應該鏈向重要的(de)頻(pín)道頁,頻(pín)道頁再鏈向下(xià)面的(de)節點頁或普通(tōng)頁面。同時(shí),頻(pín)道頁、節點頁和(hé)普通(tōng)頁面都應該可(kě)以鏈回到首頁
2)無論哪些頁面之間互相鏈接,都需要一個(gè)描述恰當的(de)錨文本
3)鏈接不要放在JS、FLASH等搜索引擎不可(kě)見的(de)位置,使用(yòng)圖片做(zuò)鏈接入口應該完善alt标簽
*百度搜索引擎目前僅支持對(duì)部分(fēn)JS和(hé)FLASH進行解析,絕大(dà)多(duō)數放在JS和(hé)FLASH裏的(de)鏈接都是獲取不到的(de)
4)爲重要頁面留更多(duō)入口。百度搜索引擎認爲,獲得(de)更多(duō)内部投票(piào)的(de)網頁相對(duì)來(lái)說更加重要
5) “離首頁越近”的(de)網頁,越容易受到百度重視。這(zhè)個(gè)“近”指的(de)是頁面離首頁的(de)點擊距離。即使URL所在目錄層級較深,隻要在首頁有入口,百度也(yě)認爲這(zhè)是一個(gè)非常重要的(de)頁面。
6)不要産生可(kě)怕的(de)孤島頁面。雖然百度在提交入口、社會化(huà)挖掘方面做(zuò)了(le)許多(duō)工作,但鏈接抓取依然是百度獲得(de)新頁面的(de)最重要渠道
二,通(tōng)過導航讓百度更好地認識站點
對(duì)于用(yòng)戶,導航要解決的(de)問題是:我在網站的(de)什(shén)麽位置,我想看上一級、甚至上上一級更多(duō)内容的(de)入口在哪裏;對(duì)于spider,導航要解決的(de)問題是:這(zhè)個(gè)頁面屬于哪個(gè)領域,要表達的(de)主題是什(shén)麽。所以說,清晰的(de)導航系統不僅有助于提高(gāo)用(yòng)戶體驗,對(duì)SEO的(de)意義也(yě)是重大(dà)的(de),所有SEO做(zuò)得(de)出色的(de)網站基本都擁有清晰明(míng)确的(de)導航。
1,導航内容搜索引擎可(kě)見:有網站的(de)導航對(duì)用(yòng)戶來(lái)說美(měi)觀友好,對(duì)百度來(lái)說卻是不可(kě)見的(de)。目前百度還(hái)不能搞定所有的(de)JS和(hé)FLASH,保險起見,還(hái)是使用(yòng)HTML的(de)好。圖片雖然美(měi)麗,作爲導航也(yě)是對(duì)搜索引擎不友好的(de)行爲。
2,導航穩定:導航内容應該是相對(duì)固定的(de),不要讓導航成爲“滾動條”。
3,重要網頁盡可(kě)能地在導航處可(kě)以follow到:百度認爲主導航中出現的(de)鏈接,其重要性僅次于網站首頁,所以應該盡量将站内的(de)頁面在主導航中安排個(gè)位置。當然,主導航上也(yě)不可(kě)能放過多(duō)的(de)内容,哪些鏈接可(kě)以上主導航還(hái)需要SEO人(rén)員(yuán)進行平衡。
4,巧用(yòng)面包屑導航:上面說到,導航對(duì)于用(yòng)戶來(lái)說,解決了(le)“想看上一級、甚至上上一級更多(duō)内容”的(de)問題,這(zhè)個(gè)導航指的(de)就是面包屑導航。面包屑導航可(kě)以使結構複雜(zá)龐大(dà)的(de)大(dà)中型網站變得(de)清晰輕盈,在spider進行頁面解析時(shí)會著(zhe)重查看面包屑導航内容,強烈建議(yì)使用(yòng)。
三,合理(lǐ)的(de)domain結構
除了(le)在網站建設的(de)時(shí)候站長(cháng)會思考到底使用(yòng)二級域名還(hái)是子目錄,在網站運營的(de)過程中,也(yě)會考慮是否要把子目錄的(de)内容拆分(fēn)成二級域名。因爲很多(duō)SEO人(rén)員(yuán)認爲二級域名相對(duì)獨立,其首頁會得(de)到百度的(de)重視,能獲得(de)更好的(de)排位——其實這(zhè)是一個(gè)片面的(de)錯誤觀點,百度會通(tōng)過很多(duō)指标對(duì)同domain下(xià)的(de)二級域名和(hé)子目錄進行重要程度判斷,并沒有武斷地認爲誰天生就會比誰強一些。
當SEO認爲站内結構已經阻礙了(le)網站高(gāo)速發展就會考慮改版,最常見的(de)改版便是将子目錄移出主站點、單獨形成二級域名。但大(dà)家都知道,改版肯定會對(duì)站點的(de)收錄排名和(hé)流量造成影(yǐng)響,一定要謹慎。那麽在什(shén)麽情況下(xià)才真的(de)需要将子目錄換成二級域名呢(ne)?其實隻有一點:即子目錄的(de)内容足夠豐富,且與主域的(de)主題關聯性不強!
四,url結構很重要
1,url結構規律化(huà):同一個(gè)網頁有不同url,會造成多(duō)個(gè)url同時(shí)被用(yòng)戶推薦導緻權值分(fēn)散;同時(shí)百度最終選擇展現的(de)那個(gè)url不一定符合你的(de)預期。站點應該盡量不把sessionid和(hé)統計代碼等不必要的(de)内容放在url,如果一定要這(zhè)樣做(zuò)可(kě)以通(tōng)過robots禁止百度抓取這(zhè)些非規範url
2,最好能讓用(yòng)戶從url即可(kě)判斷出網頁内容,便于蜘蛛解析的(de)同時(shí)便于用(yòng)戶間傳播
3,url盡量短
●蜘蛛喜歡:http://tieba.baidu.com.com/f?kw=百度
●蜘蛛不喜歡:http://tieba.baidu.com/f?ct=&tn=&rn=&ln=&cn=0&kw=百度&rs2=&un=&rs1=&rs5=&sn=&rs6=&nvselectvalue=0&oword=百度&tb=cn
4,不要添加蜘蛛難以解析的(de)字符,如
http://mp3.XXX.com/albumlist/234254;;;;;;;%B9&CE%EDWF%.html
http://news.xxx.com/1233,242,111,0.shtml
5,動态參數不要太多(duō)太複雜(zá),目前百度對(duì)動态url已經有了(le)很好的(de)處理(lǐ),但是參數過多(duō)過複雜(zá)的(de)url有可(kě)能被蜘蛛認爲不重要而抛棄