搜索引擎蜘蛛的抓取策略
來源:SEO優(yōu)化 2012-07-12
這篇文章主要講解搜索引擎的蜘蛛爬蟲的工作原理,包括它的四種抓取策略。
首先呢,搜索引擎的蜘蛛抓取網(wǎng)頁是有著一定的規(guī)律,不會去隨便抓取網(wǎng)頁,并且呢,蜘蛛是通過超連接來抓取網(wǎng)頁的,我們剛剛說了,搜索引擎有四種抓取網(wǎng)頁的策略,下邊我們一一講解。
深度優(yōu)先
所謂深度優(yōu)先,就是蜘蛛在一個頁面中發(fā)現(xiàn)第一個超鏈接,然后爬取這個頁面,當爬到第二個頁面后,在第二個頁面發(fā)現(xiàn)的第一個超鏈接,然后再順著往下爬,如下圖:
深度優(yōu)先,導致蜘蛛抓取的網(wǎng)頁的質(zhì)量,越來越低,并且在傳遞網(wǎng)站權(quán)重上,也有著根本的問題。
寬度優(yōu)先
在深度優(yōu)先上,搜索引擎有著根本的問題,那么在之后,搜索引擎又推出了蜘蛛抓取的第二個策略,也就是寬度優(yōu)先,寬度優(yōu)先指的是,蜘蛛會先把這個頁面所有的鏈接都爬一次,然后在順著這些鏈接往下爬,如下圖:
但是寬度優(yōu)先也存在著問題,那就是蜘蛛抓取的效率和質(zhì)量問題。
先寬后深 – 權(quán)重優(yōu)先
現(xiàn)在搜索引擎是寬度和深度優(yōu)先的結(jié)合,蜘蛛在抓取一個網(wǎng)頁的時候,會先把這個頁面所有的鏈接都抓取一次,然后再根據(jù)這些ULR的權(quán)重來判定,那個URL的權(quán)重高,那么就采用深度優(yōu)先,那個URL權(quán)重低,就采用寬度優(yōu)先或者不抓取。
重訪抓取策略
重訪抓取策略,是最后的一個,搜索引擎蜘蛛在抓取完這個網(wǎng)頁之后,然后根據(jù)這個頁面的權(quán)重、包括它的更新頻率、更新質(zhì)量、外鏈的數(shù)量等等來判定,那么對于權(quán)重高的頁面,蜘蛛會在相隔較短的時間段在回來重新抓取,比如新浪網(wǎng),權(quán)重很高,搜索引擎蜘蛛都是按照秒來重新抓取的。而對于一些權(quán)重較低的頁面,比如長期不更新的頁面,那么蜘蛛會隔好長時間在來抓取一次,比如我們常常搜索的百度大更新,蜘蛛就是對于一些網(wǎng)頁權(quán)重較低的頁面進行一次全部的抓取,一般情況,百度大更新,一個月一次。
本文來源 / 轉(zhuǎn)載留下版權(quán)
感謝 史占強 的投稿
文章編輯: 365webcall網(wǎng)上客服工具(www.365webcall.com)
我的評論
登錄賬號: | 密碼: | 快速注冊 | 找回密碼 | ![]() |
| 掀开奶罩边躁狠狠躁喷白浆 | 国产美女在线自卫福利姬 | 成人av一区二区三区 | 夜夜躁狠狠躁日日躁一区 | 国内偷拍 日韩 欧美 | 日韩人妻无码精品一区二区三区电影 | 国产精品国产三级国产在线观看 | 免费无码婬片AAAA片榴莲 | 国产传媒在线免费观看 | av中文字幕在线观看 | 综合一区中文字幕 | 四川少妇BBBBBBB视频 | 少妇高潮灌满白浆毛片免费看小说 | 浮奶一级婬片A片免费播放 涩爱av无码一区二区人妻 | 欧美一级黃色A片免费看蜜桃 | 美女扒开尿口让男人桶 | 99热这里只有精品9 午夜剧场 成人 av | 精品国产一区二区三区久久狼黑人 | 中文字幕日本被黑人无码 | 国产精华一区二区三区 | 精品免费一区二区三区 | www免费视频在线观看播放 | 91丨精品丨国产丨蜜挑 | 免费少妇A级毛片野外大战 蜜桃人妻一区二区三区欧美 | 91无码精品国产AⅤ 中文字幕熟女人妻偷伦 | 亚洲熟女乱综合一区二区牛牛影视 | “ 内射 ” 的搜索结果 | 精品亚洲A∨无码国产一品在线 | 夜精品A片一区二区无码高跟 | 欧美性大战XXXXX久久久路亚技术参考 | 国产全黄A级A片一免费男同 | 欧美成人在线视频人妻 | 精品人妻一区二区三区视频53一 | 黄色视频免费观看中文 | 97无码欧美熟妇人妻蜜桃天美 | 农村婬乱生活A片1一15 | 五十路09豊满十9肉体 | 人人妻人人澡人人爽国产一区 | 韩国青草自慰喷水无码 | 黄色视频网站在线观看免费 |