1:網站當中的(de)圖片全部添加水(shuǐ)印,這(zhè)樣也(yě)等于宣傳了(le)自己的(de)網站 asp防采集
當你的(de)文章(zhāng)中含有圖片時(shí)候,可(kě)以給圖片打上水(shuǐ)印,這(zhè)樣就留下(xià)了(le)你的(de)信息,對(duì)方要采集或者複制您文章(zhāng)後,不可(kě)能一張一張的(de)去處水(shuǐ)印,這(zhè)樣也(yě)算(suàn)是變相地幫助我們宣傳網站。
2:内容随機穿插版權信息
在不影(yǐng)響用(yòng)戶閱讀體驗的(de)情況下(xià),盡量在内容段落之間随機插入一些之間的(de)信息,比如:網站名字,鏈接,版權作者,QQ等,這(zhè)樣的(de)話(huà),就算(suàn)對(duì)方使用(yòng)采集器過濾也(yě)不可(kě)能每篇文章(zhāng)都能過濾得(de)掉。本文來(lái)源 www.021jz.com.cn
3:主動推送網址給百度收錄
百度給出的(de)鏈接提交方式有以下(xià)三種:
a、主動推送:最爲快(kuài)速的(de)提交方式,推薦您将站點當天新産出鏈接立即通(tōng)過此方式推送給百度,以保證新鏈接可(kě)以及時(shí)被百度收錄。
b、sitemap:您可(kě)以定期将網站鏈接放到sitemap中,然後将sitemap提交給百度。百度會周期性的(de)抓取檢查您提交的(de)sitemap,對(duì)其中的(de)鏈接進行處理(lǐ),但收錄速度慢(màn)于主動推送。
c、手工提交:一次性提交鏈接給百度,可(kě)以使用(yòng)此種方式。
4:利用(yòng)JS加密網頁内容
這(zhè)個(gè)方法是在個(gè)别網站上看到的(de),非常暴力。缺點:搜索引擎爬蟲無法識别收錄和(hé)通(tōng)殺所有采集器,針對(duì)極度討(tǎo)厭搜索引擎和(hé)采集器的(de)網站的(de)站長(cháng)使用(yòng),量力而行,您能豁出去了(le),别人(rén)也(yě)就沒辦法采集你了(le)。
5:網站随機采用(yòng)不同模版
分(fēn)析:因爲采集器是根據網頁結構來(lái)定位所需要的(de)内容,一旦先後兩次模版更換,采集規則就失效,不錯。而且這(zhè)樣對(duì)搜索引擎爬蟲沒影(yǐng)響。
适用(yòng)網站:動态網站,并且不考慮用(yòng)戶體驗。
采集器會怎麽做(zuò):一個(gè)網站模版不可(kě)能多(duō)于10個(gè)吧,每個(gè)模版弄一個(gè)規則就行了(le),不同模版采用(yòng)不同采集規則。如果多(duō)于10個(gè)模版了(le),既然目标網站都那麽費勁的(de)更換模版,成全他(tā),撤。
6:利用(yòng)腳本語言做(zuò)分(fēn)頁(隐藏分(fēn)頁)
分(fēn)析:還(hái)是那句,搜索引擎爬蟲不會針對(duì)各種網站的(de)隐藏分(fēn)頁進行分(fēn)析,這(zhè)影(yǐng)響搜索引擎對(duì)其收錄。但是,采集者在編寫采集規則時(shí),要分(fēn)析目标網頁代碼,懂(dǒng)點腳本知識的(de)人(rén),就會知道分(fēn)頁的(de)真實鏈接地址。
适用(yòng)網站:對(duì)搜索引擎依賴度不高(gāo)的(de)網站,還(hái)有,采集你的(de)人(rén)不懂(dǒng)腳本知識。
采集器會怎麽做(zuò):應該說采集者會怎麽做(zuò),他(tā)反正都要分(fēn)析你的(de)網頁代碼,順便分(fēn)析你的(de)分(fēn)頁腳本,花不了(le)多(duō)少額外時(shí)間。
7:限制IP地址單位時(shí)間的(de)訪問次數
分(fēn)析:沒有哪個(gè)常人(rén)一秒鐘(zhōng)内能訪問相同網站5次,除非是程序訪問,而有這(zhè)種喜好的(de),就剩下(xià)搜索引擎爬蟲和(hé)討(tǎo)厭的(de)采集器了(le)。
弊端:一刀(dāo)切,這(zhè)同樣會阻止搜索引擎對(duì)網站的(de)收錄。
适用(yòng)網站:不太依靠搜索引擎的(de)網站。
采集器會怎麽做(zuò):減少單位時(shí)間的(de)訪問次數,減低采集效率。