黄 色 片 在 线 看-黄 色 免费网 站 成 人-黄 色 免 费 网站在线观看-黄 色 毛片免费-青草视频在线-青草视频在线播放

一站式電子商務(wù)網(wǎng)絡(luò)營銷機(jī)構(gòu)!
NEWS
新聞觀點(diǎn)
首頁 > 新聞觀點(diǎn) > 觀點(diǎn)/分享 > 搜索引擎工作原理之蜘蛛如何爬行和抓取網(wǎng)頁

搜索引擎工作原理之蜘蛛如何爬行和抓取網(wǎng)頁

標(biāo)簽: 搜索引擎工作原理   | 作者:眾騰網(wǎng)絡(luò) | VISITORS:3444 | 來源:www.dxbaba.cn
01
SEP
2015

    搜索引擎工作的流程是非常復(fù)雜的,今天桂林眾騰網(wǎng)絡(luò)介紹在蜘蛛在對網(wǎng)頁進(jìn)行爬行和抓取過程中,對我們網(wǎng)站優(yōu)化有重要影響的幾個部分。


      當(dāng)搜索引擎蜘蛛準(zhǔn)備爬行某個網(wǎng)頁的時候,會對服務(wù)器發(fā)出訪問申請,申請通過后,搜索引擎會先去爬行網(wǎng)站的robots.txt文件,針對robots.txt文件中所禁止搜索引擎抓取的部分,搜索引擎將不會去抓取。接著服務(wù)器就會給搜索引擎返回當(dāng)前頁面的html代碼,現(xiàn)在有很多的站長工具中都會有模仿蜘蛛抓取網(wǎng)頁代碼的功能,大家有興趣可以去查詢,這里值得注意的就是頁面代碼中漢字所占的比例,因為搜索引擎在預(yù)處理階段會把漢字部分篩選出來分析網(wǎng)頁的內(nèi)容和關(guān)鍵詞,漢字所占比例越多說明網(wǎng)頁返回的有效信息越多,越有利于搜索引擎對頁面的分析。這也就是為什么大家在編寫網(wǎng)站代碼的時候,會對CSS和Javascript代碼進(jìn)行外部調(diào)用,對圖片要添加alt屬性,對鏈接要添加title屬性的緣故,都是為了降低頁面代碼所占的比例,提高文字所占比例,當(dāng)然相關(guān)性也是一方面。


      搜索引擎爬行網(wǎng)頁都是沿著鏈接進(jìn)行爬行的,在爬行網(wǎng)頁的時候并不是一個蜘蛛在爬行,一般都是由多個蜘蛛進(jìn)行爬行,爬行的方式有兩種,一種是深度爬行,一種是廣度爬行,兩種方式都可以爬遍一個網(wǎng)站的所有鏈接,通常都是兩種方式并行的,但實際上由于資源的限制,搜索引擎并不會爬遍一個網(wǎng)站的所有鏈接。


      既然搜索引擎不可能爬遍整個網(wǎng)站的所有鏈接,那么我們seoer接下來的工作就是要吸引蜘蛛盡可能多的去爬行網(wǎng)站鏈接,為蜘蛛的爬行創(chuàng)造輕松便利的環(huán)境,尤其是針對一些重要的鏈接。


      如何去吸引蜘蛛呢?影響蜘蛛爬行的因素有哪些呢?

      1.網(wǎng)站的權(quán)重。一個權(quán)重高的網(wǎng)站,蜘蛛往往會爬行的很深,關(guān)于如何提高網(wǎng)站的權(quán)重,大家可以去參考狄吉堂網(wǎng)站seo博客中的影響網(wǎng)站權(quán)重計算的因素有哪些和如何提高網(wǎng)站權(quán)重的五種方式兩篇文章。


      2.頁面是否經(jīng)常更新。這是一個老生常談的問題了,雖然網(wǎng)站的更新和維護(hù)工作異常的辛苦,但是沒辦法,人家搜索引擎就喜歡新鮮的血液,如果網(wǎng)站的更新比較勤快的話,搜索引擎自然來的也勤快,來的多了,新鏈接被抓取的幾率當(dāng)然也就大了。


      3.高質(zhì)量導(dǎo)入鏈接。一個頁面的導(dǎo)入鏈接相當(dāng)于頁面的入口,原理很簡單,導(dǎo)入鏈接多了,搜索引擎進(jìn)入你網(wǎng)頁的渠道也就多了,如果是一條高質(zhì)量的導(dǎo)入鏈接,那么搜索引擎對網(wǎng)頁鏈接爬行的深度也會增加。


      4.與首頁距離越近的鏈接,被爬行的幾率越大。一個網(wǎng)站的首頁是權(quán)重最高的,那么距離它越近的頁面,被賦予的權(quán)重也會越高,被蜘蛛爬行的幾率當(dāng)然越大,這是網(wǎng)站seo優(yōu)化中常用到的一個就近原理,可以應(yīng)用到很多方面,比如網(wǎng)站的主導(dǎo)航中第一個欄目比最后一個欄目的權(quán)重高,距離錨文本越近的文字是搜索引擎重點(diǎn)照顧的地方等等。


      當(dāng)搜索引擎對頁面進(jìn)行抓取之后,會將頁面中的鏈接解析出來,通過與地址庫中的鏈接進(jìn)行匹配對比分析,將沒有進(jìn)行爬行的新鏈接放入到待訪問地址庫,然后派出蜘蛛對新鏈接進(jìn)行爬行。


      在搜索引擎對網(wǎng)頁進(jìn)行爬行和抓取的時候,并不是進(jìn)行簡單的爬行和抓取工作,而是同時并發(fā)有大量的其他操作,其中很重的一項工作就是對網(wǎng)頁內(nèi)容進(jìn)行檢測,通過截取網(wǎng)頁上的內(nèi)容與數(shù)據(jù)庫中的信息做對比,如果是一些權(quán)重比較低的網(wǎng)站出現(xiàn)大量轉(zhuǎn)載或者偽原創(chuàng),可能蜘蛛爬行到一半就會離開,這也就是為什么通過網(wǎng)站日志看到有蜘蛛來,但是頁面沒被收錄的原因。所以說,即使是進(jìn)行偽原創(chuàng),也是需要一定的技巧的,除非你的網(wǎng)站權(quán)重特別高。



轉(zhuǎn)載聲明:本文由桂林眾騰網(wǎng)絡(luò)原創(chuàng)文章
轉(zhuǎn)載請注明來源: http://zt-web.com/shows.php?id=519
相關(guān)新聞
首頁 | 關(guān)于我們 |公司服務(wù) | 經(jīng)典案例 |新聞觀點(diǎn) | 服務(wù)客戶 | 聯(lián)系我們
主站蜘蛛池模板: 成人公开免费视频| 国产综合精品一区二区| 污污网站在线观看| 黄频免费看| 激情综合网激情| 在线黄视频| 麻豆女| 黄页网站在线播放| 国产在线成人a| 中文国产成人精品久久水| 你懂的中文字幕| 精品一区二区三区免费毛片爱| 精品国产理论在线观看不卡| 最色成人网| 四虎精品永久免费| 91在线麻豆| 四虎影视4hu最新地址在线884 | 成人午夜视频免费| 四虎影院精品| 久久a 热6| 一久久| 亚洲成人精品| 华人91视频| 成人国产三级精品| 中文字幕丝袜制服| 久久美| 亚洲一区二区三区久久| 香蕉国产成版人视频在线观看| 国产成人午夜精品免费视频| 免费毛片播放| 99久久久久国产精品免费| 日韩精品欧美国产精品亚| 伊人蕉| 天天色综合天天| 国产亚洲欧美一区二区三区 | 色噜噜狠狠狠综合曰曰曰88av| 午夜亚洲一区| 在线观看国产小视频| 台湾一级毛片永久免费| 韩国19禁视频一区二区| 不卡在线一区|