1,防止一樣内容有不一樣網址:這(zhè)個(gè)做(zuò)搜索引擎優化(huà)兄弟(dì)都會接觸到,即是一個(gè)網站假如有僞靜态設置的(de)話(huà),通(tōng)常會出現一個(gè)動态網址和(hé)一個(gè)僞靜态網址,可(kě)是裏邊的(de)内容是一樣的(de),這(zhè)麽baidu錄入後會發現不一樣網址内容一樣,不是很友好。
2,與期望的(de)錄入網址不一樣:比方一些咱們不期望被搜索引擎錄入的(de)網址被錄入了(le),通(tōng)常咱們期望baidu等搜索引擎能夠錄入咱們網站的(de)僞靜态網址,而去掉對(duì)應的(de)動态網址。
3,權重渙散了(le):還(hái)有一個(gè)疑問即是一個(gè)動态的(de)網址和(hé)對(duì)應的(de)僞靜态網址,假如沒有标準化(huà),這(zhè)麽這(zhè)個(gè)頁面的(de)權重會渙散,假如标準化(huà)301指向一個(gè)網址的(de)話(huà),能夠使這(zhè)個(gè)頁面的(de)權重得(de)到會集。
那麽關于網站URL内沒有标準化(huà)的(de)網址咱們有什(shén)麽應對(duì)3辦法呢(ne),簡略說說。
1,網站中隻運用(yòng)标準化(huà)鏈接:比方咱們期望運用(yòng)加www.的(de)網址,那麽在咱們優化(huà)站内的(de)時(shí)分(fēn),隻需出現内部鏈接的(de)當地全部都運用(yòng)加www.的(de)寫法,這(zhè)麽無論是實在的(de)用(yòng)戶仍是搜索引擎蜘蛛也(yě)都會順著(zhe)www.的(de)網址進行抓取,在必定程度上标準了(le)網站的(de)網址。
2,用(yòng)301跳轉或許運用(yòng)canonical标簽:能夠依據自個(gè)站點的(de)程序或許空間上進行301跳轉到标準化(huà)網址,或許在head中運用(yòng)canonical标簽,詳細用(yòng)法是在head之間加上(前面加“<”)link rel="canonical" href="本頁面的(de)标準化(huà)網址" data-ke-src="本頁面的(de)标準化(huà)網址" /(後邊加“>”)即可(kě)。
3,用(yòng)robots.txt屏蔽掉不标準的(de)網址:你能夠在robots.txt加上屏蔽掉不标準的(de)網址,比方屏蔽掉動态頁面加上Disallow: /*?*,詳細的(de)能夠依據實際情況進行調整。
SEO網址定律:規範的(de)網址書(shū)寫方式,有利于提高(gāo)網站主頁權重。
1、出現不規範網址的(de)原因
搜索引擎會自動挑選最合适的(de)URL做(zuò)爲一個(gè)網站的(de)網址。衆所周知,我們打開IE在地址欄裏輸入網址,根據各人(rén)用(yòng)戶體驗的(de)習(xí)慣不同,輸入的(de)方式也(yě)不同。這(zhè)就是會出現不規範的(de)網址的(de)原因。如:
l http://021jz.com.cn
l http://www.021jz.com.cn
l /
l /index.html
l https://www.021jz.com.cn(較少使用(yòng))
以上這(zhè)五種常見的(de)輸入網址的(de)方式,明(míng)眼能看出來(lái)其實是指向同一個(gè)頁面:主頁。
從技術上來(lái)說,在計算(suàn)機處理(lǐ)時(shí),每一個(gè)字符對(duì)應一個(gè)編碼(詳見計算(suàn)機科學導論類書(shū)籍);而搜索引擎是把以上網址當成不同的(de)地址來(lái)看待,雖然最終返回的(de)都是主頁。
現在簡要分(fēn)析一下(xià)以上網址的(de)技術問題:
有沒有帶www,有什(shén)麽不同?在DNS中,www是你要解析的(de)主機名。在做(zuò)域名解析時(shí),會要你爲域名:021jz.com.cn填寫一個(gè)主機名,我們一般填:www 。當然,也(yě)可(kě)以填 bbs或者其它的(de)諸如abcde等等。如果填,那麽,主機返回的(de)頁面就不一樣。對(duì)搜索引擎來(lái)說,這(zhè)是兩個(gè)不同的(de)站點,兩個(gè)不同的(de)頁面。兩個(gè)都要計算(suàn)PR值。
具例:http://www.021jz.com.cn和(hé)http://focus.021jz.com.cn在搜索引擎看來(lái)就是兩個(gè)不同的(de)站點。其中,http://www.021jz.com.cn的(de)PR值爲8,而http://focus.021jz.com.cn的(de)PR值等于6。但從人(rén)爲上判斷,這(zhè)其實是同一個(gè)站點。
另一個(gè)問題,帶與不帶index.html,對(duì)用(yòng)戶感覺沒什(shén)麽區(qū)别。但對(duì)蜘蛛說就感到比較暈:哪一個(gè)才是主頁?蜘蛛到底該返回哪個(gè)頁面?這(zhè)種方法對(duì)蜘蛛不友好。
https是加密網址,可(kě)以理(lǐ)解爲http的(de)安全版,端口:443,采用(yòng)SSL協議(yì),詳見《TCP/IP協議(yì)》有關書(shū)籍。如果和(hé)http同時(shí)存在也(yě)會被認爲是不同的(de)頁面,搜索引擎會分(fēn)别計算(suàn),從而降低了(le)http://www.021jz.com.cn頁面的(de)權重。如:http://mail.139.com的(de)PR值等于6,而https://mail.139.com的(de)PR值爲:n/a。
以上的(de)不同的(de)域名寫法,造成的(de)PR值的(de)不同
所以,一個(gè)網址在推廣時(shí),網址的(de)規範寫法很重要。這(zhè)直接影(yǐng)響到域名的(de)權重。而不帶www的(de)域名,對(duì)搜索引擎很不友好。畢竟蜘蛛是程序,在不規範的(de)網址中要挑一個(gè)出來(lái)做(zuò)爲規範的(de)網址,不僅浪費主頁的(de)權重,而且還(hái)浪費蜘蛛的(de)時(shí)間和(hé)網絡帶寬。要知道,蜘蛛一生氣,後果很嚴重。
2、避免不規範網址降低網站首頁權重
據估計,現在網絡上的(de)網址,不規範的(de)寫法近30%。在浪費資源,浪費帶寬的(de)同時(shí),有可(kě)能搜索引擎選出的(de)規範網址并不是站長(cháng)想要的(de)。對(duì)站長(cháng)來(lái)說,多(duō)個(gè)不規範的(de)URL鏈接的(de)存在不但不利于排名,更是分(fēn)散了(le)主頁的(de)權重。不規範的(de)影(yǐng)響了(le)網站的(de)收錄不是好事,必須避免。
避免不規範網址,不管是新站還(hái)是老站,都是要長(cháng)期跟進的(de)一項工作。要有恒心才能見到效果。新站從一開始就注意到這(zhè)點的(de)話(huà),一兩年後,效果還(hái)是很明(míng)顯的(de)。具體如下(xià):
l 新站在發展友鏈時(shí),盡可(kě)能地要求對(duì)方規範書(shū)寫網址,統一寫法。而老站,應盡可(kě)能地修複不規範的(de)友鏈。
l 内鏈中,首先自已要規範書(shū)寫網址,文章(zhāng)發布時(shí),也(yě)要規範書(shū)寫網址。
l 谷歌(gē)管理(lǐ)工具中,将不帶3w的(de)網址以及其它不規範的(de)寫法定向爲帶3w的(de)規範網址。
l 使用(yòng)canonical标簽。下(xià)節討(tǎo)論。
l 制作sitemap文件,在sitemap文件裏全部使用(yòng)規範網址,以利蜘蛛爬行。
l 一些CMS中添加了(le)許多(duō)文章(zhāng),裏面如有大(dà)量内鏈不規範,可(kě)在robots文件中禁止蜘蛛爬行,在修複後,再允許蜘蛛爬行。
l 無論網站是否有靜态化(huà)的(de)功能,在開發和(hé)對(duì)系統設置時(shí)要做(zuò)到系統隻産生規範網址。
l 設置.htaccess文件,用(yòng)301重定向把其他(tā)URL重定向到規範網址。
以上提到的(de)方法可(kě)混合使用(yòng),具體情況靈活處理(lǐ)。網址規範化(huà)是讓站長(cháng)和(hé)蜘蛛非常困擾的(de)一個(gè)課題。需要站長(cháng)長(cháng)期堅持才能見效。
3、canonical标簽與301重定向
在2009年,Google,雅虎,微軟共同發布了(le)一個(gè)新的(de)标簽:canonical tag,用(yòng)于解決網址規範化(huà)問題。canonical标簽有什(shén)麽用(yòng)?
1. 網址規範。
2. 傳遞、繼承頁面權重。
3. 重複頁面精确重定向,利于蜘蛛收錄。
注意,canonical标簽隻對(duì)同一域名下(xià)的(de)網址有效,如果跨站,建議(yì)用(yòng)301重定向。這(zhè)就是canonical标簽與301重定向的(de)區(qū)别所在。
如下(xià)面所示網址的(de)頁面是相同的(de)
/archives
/archives/123.html
/archives/234.html
那麽我們可(kě)以在head meta部分(fēn)加入如下(xià)代碼:
這(zhè)樣是告訴搜索引擎:後兩個(gè)頁面的(de)内容是重複内容,是同一個(gè)頁面,就是告知搜索引擎把相關的(de)搜索信号都傳遞到第一個(gè)網址。
這(zhè)樣一樣所有含有這(zhè)個(gè)标簽的(de)網頁,不管它的(de)URL是什(shén)麽,搜索引擎最終都會隻收錄 canonical标簽指定的(de)那個(gè)頁面,所有的(de)權重也(yě)會在指定的(de)這(zhè)個(gè)頁面上繼承。這(zhè)樣,所有原本分(fēn)散的(de)權重都會集中傳遞在指定的(de)這(zhè)個(gè)頁面上。
另外,使用(yòng)canonical标簽要注意以下(xià)幾點:
1. 這(zhè)個(gè)标簽隻是對(duì)搜索引擎起到參考和(hé)建議(yì)的(de)作用(yòng),并不是像robots文件那樣是個(gè)命令,就算(suàn)是做(zuò)了(le)canonical标簽,也(yě)不百分(fēn)百保證是搜索引擎認可(kě)的(de)規範網址,搜索引擎會智能地綜合參考其他(tā)的(de)因素進行判斷。
2. 在canonical标簽中,最好使用(yòng)絕對(duì)地址,雖然可(kě)以使用(yòng)相對(duì)地址。
3. 針對(duì)國内用(yòng)戶的(de)網站特别注意,百度不支持這(zhè)個(gè)标簽。
4. canonical标簽指定的(de)網址可(kě)以是不存在的(de)頁面内容,如404頁面。如果閑得(de)沒事幹的(de)話(huà)可(kě)以這(zhè)麽做(zuò)。
5. 建議(yì)canonical标簽在同一域名下(xià)使用(yòng)。是否跨站,争議(yì)太大(dà)。
什(shén)麽是301轉向?301轉向也(yě)叫301網址重定向,是用(yòng)戶或者搜索引擎在向服務器發出請求指令時(shí),服務器返回HTTP頭的(de)一個(gè)信息(一個(gè)代碼,如:301、404等),用(yòng)來(lái)告訴用(yòng)戶或蜘蛛:原來(lái)的(de)網址現在不用(yòng)了(le),永遠(yuǎn)轉向新啓用(yòng)的(de)新網址。
301轉向,能使新域名繼承老域名的(de)權重。
cmfu是起點的(de)老域名,而qidian是新域名。
老域名cmfu.com用(yòng)301轉向新域名,權重也(yě)轉向新域名。而老域名則被永遠(yuǎn)認爲被轉到qidian.com這(zhè)個(gè)新域名上了(le)。
做(zuò)301域名轉向,可(kě)以用(yòng).htaccess文件,JS代碼(如國内某知名電信服務運營商,大(dà)家可(kě)以查看其JS代碼),ASP代碼、PHP代碼。
現具例如下(xià):
Redirect 301 /path/from/ file.html http://www.domain.tld/path/file.html
上面的(de)代碼加到.htaccess文件中,主要是告訴搜索引擎,以後所有到/path/from/ file.html的(de)請求,都轉到http://www.domain.tld/path/file.html上。301狀态碼,就是告訴蜘蛛,原來(lái)的(de)頁面被永遠(yuǎn)轉走了(le)。
前面我們提到,将所有不規範的(de)不帶3w的(de)網址轉到規範的(de)網址上。這(zhè)時(shí)就要打開.htaccess文件進行修改。我們打開一個(gè)網站的(de).htaccess文件,中文是我添加的(de)注釋:
##
##如果要使用(yòng)複定向模塊,這(zhè)個(gè)選項必須是On
# if you want to use mod_rewrite, set this 'On'
RewriteEngine On
# the path to your site installation
RewriteBase /
# Maintenance Section - Uncomment the lines below according to your need
# Write below your client IP address (e.g.: 127.0.0.1)
# if you need to keep your web access during maintenance
#RewriteCond %{REMOTE_ADDR} !^127.0.0.1$
# Choose your way of closing the access to PMF:
# a. you can simply forbid access (HTTP 403 Error)
#RewriteRule ^(.*)$ underMaintenance.htm [F,L]
# b. return the user an explanation
#RewriteRule ^(.*)$ underMaintenance.htm [L]
##将所有不帶3w的(de)網址,轉爲帶3w的(de)規範網址。重定向代碼須要寫在所有的(de)代碼前面。
# url canonicalization
RewriteCond %{http_host} ^abcde.com [NC]
RewriteRule ^(.*)$ http://www.abcde.com/$1 [L,R=301]
##404錯誤頁面
# 404 page
ErrorDocument 404 /404.html
使用(yòng)301注意一點:HTML靜态頁面不支持。接下(xià)來(lái)看看在PHP中如何做(zuò)301重定向代碼:
Header(“HTTP/1.1 301 Moved Permanently”);
Header(“Location:http://www.021jz.com.cn”);
将上面的(de)兩行代碼加到PHP代碼中即可(kě)。
301重定向,還(hái)有以下(xià)用(yòng)途:
l 多(duō)個(gè)域名如.cn,.net,.org,.cc等全部轉向主域名.com。
l Domaina123b123c123d123e123.com可(kě)以轉來(lái)短域名:doabcde.com
l 網站改版、URL命名系統改變。
l 動态化(huà)的(de)URL轉靜态化(huà)的(de)URL。