服務器
想要能夠正常的(de)訪問網站,首先要保證服務器的(de)穩定性。網站就好比是搭建在地面上的(de)樓房(fáng),而服務器就是承載樓房(fáng)的(de)地基。沒有牢固結實的(de)地基,那麽建立在其上的(de)樓房(fáng)就有随時(shí)倒塌的(de)危險。如果服務器不穩定,蜘蛛在抓取的(de)時(shí)候就随時(shí)有可(kě)能面臨樓房(fáng)坍塌的(de)危險,就會導緻爬行抓取失敗,對(duì)這(zhè)樣的(de)網站蜘蛛是非常不友好的(de)。
域名
新域名一般是不會有問題的(de),但如果使用(yòng)的(de)域名是老域名就必須無任何不良記錄,如果域名被計入黑(hēi)名單,有過作弊行爲,被k過,這(zhè)樣的(de)域名來(lái)建站是很難被收錄的(de)。
協議(yì)
每一個(gè)網站就好像是站長(cháng)自己的(de)私密房(fáng)間,既然是私密的(de),那麽當有人(rén)要來(lái)拜訪的(de)時(shí)候就必須得(de)遵守主人(rén)的(de)協議(yì)了(le),至少也(yě)得(de)先敲敲門、打聲招呼吧。一樣的(de)道理(lǐ),蜘蛛到達網站之後,首先也(yě)是要和(hé)網站打聲招呼的(de),這(zhè)個(gè)就是robots.txt協議(yì)了(le)。每一個(gè)站長(cháng)都必須在網站添加一份robots協議(yì),告訴蜘蛛網站方不方便訪問,如果是robots是禁止的(de)寫法,蜘蛛就不會再繼續訪問,如果是同意的(de)寫法,蜘蛛将按照(zhào)協議(yì)進行爬行。雖然隻是一份很簡單的(de)協議(yì),卻也(yě)是尤其重要的(de),這(zhè)直接關系到網站能不能收錄的(de)問題,新站長(cháng)們尤其要特别關注一下(xià)。至于robots的(de)寫法和(hé)堅持方法,網上有很多(duō)教程,大(dà)家自己去搜索一番即可(kě)得(de)到想要的(de)。
以上就是蜘蛛的(de)爬行規則,了(le)解了(le)蜘蛛的(de)爬行規則,我們再來(lái)看看哪些是對(duì)收錄有幫助的(de)。
内容
保證了(le)蜘蛛能夠正常訪問和(hé)抓取的(de)問題之後,自然是頁面内容豐富的(de)問題。一個(gè)網站如果沒有任何内容,就算(suàn)來(lái)再多(duō)的(de)蜘蛛爬行,也(yě)抓取不到任何的(de)信息,更加不會被收錄。蜘蛛比較喜歡新鮮的(de)原創性的(de)文字内容,對(duì)于圖片視頻(pín)的(de)抓取目前還(hái)是比較困難,所以對(duì)網站增加原創文章(zhāng)的(de)方法是快(kuài)速收錄的(de)不二之選。
HTML靜态頁面
筆者發現動态URL鏈接其實也(yě)是可(kě)以收錄的(de),像很多(duō)的(de)論壇鏈接都是動态的(de),收錄一樣不錯。實際上動态頁面是可(kě)以收錄,隻是相比較靜态頁面比較繁雜(zá)一些。相對(duì)而言,蜘蛛更加喜歡簡潔的(de)HTML頁面,爬行抓取會更加輕松不費什(shén)麽力氣。
URL層級
層級優化(huà)很多(duō)人(rén)都建議(yì)三級欄目,即首頁--欄目頁--内容頁。這(zhè)樣的(de)層級是最簡潔的(de),簡潔簡短的(de)URL是受蜘蛛青睐的(de),會更加容易爬行。這(zhè)裏建議(yì)層級命名盡量簡短好記,層級盡量縮短,減少蜘蛛爬行困難。當然并非是說一定要是三級層級,根據網站需求調整,筆者看到有一些網站也(yě)是四級欄目,收錄也(yě)是挺好的(de),這(zhè)并不是取決收錄的(de)唯一标準。
sitemap網站地圖
顧名思義,網站地圖就是站長(cháng)爲搜索引擎蜘蛛制作的(de)一份網站URL鏈接爬行地圖指南(nán)。有了(le)這(zhè)份地圖,蜘蛛爬行會更新方便簡單,不會出現迷路的(de)情況,對(duì)網站也(yě)就會生出更多(duō)的(de)好感。
看到這(zhè)裏,不知道讀者們有無了(le)解清楚,要如何做(zuò)才能夠提高(gāo)網站的(de)收錄問題。想要新網站能夠快(kuài)速的(de)被收錄,就必須要了(le)解收錄的(de)原理(lǐ)。從穩定的(de)服務器,域名的(de)選擇,robots協議(yì)的(de)正确寫法等等,再到對(duì)網站内容、頁面、層級、sitemap的(de)優化(huà),都是爲了(le)使網站能夠得(de)到搜索引擎蜘蛛的(de)青睐,讓更多(duō)的(de)搜索引擎蜘蛛能夠來(lái)爬行網站,這(zhè)樣才能提高(gāo)網站的(de)收錄。