盐城鹤翔网络 咨询电话
seo密码

蜘蛛爬取网站的基本方式

发布时间:2013年9月28日 发布人:鹤翔网络

为抓取到网站上尽量多的页面,搜索引擎蜘蛛会跟踪网页上的链接,从一个页面爬到下一个页面,这和蜘蛛在蜘蛛网上爬行是一样的,这也就是搜索引擎机器人称为蜘蛛的由来。
    整个互联网是由相互链接的网站及页面组成的。从理论上说,蜘蛛可以从任何一个页面出发,顺着链接可以爬行到网上任何一个页面。当然,由于网站及页面链接结构异常复杂, 蜘蛛需要采取一定的爬行策略才能行走于整个互联网海洋。
    通常搜索引擎蜘蛛爬行遍历策略分有两种,一种是深度优先,另一种是广度优先。
    所谓深度优先,指的是蜘蛛沿着发现的链接一直向前爬行,直到前面再也没有其他链接,正所谓不撞南墙;然后返回到第一个页面,沿着另一个链接再一直往下爬行。

蜘蛛爬取网站的基本方式

    如图1所示,蜘蛛跟踪链接,从A页面爬行到Al,A2, A3,A4,到A4页面后, 己经没有其他链接可以跟踪就返回A页面,顺着页面上的另一个链接,爬行到Bl,B2, B3, B4。在深度优先策略中,蜘蛛一直爬到这个链接的尽头,在返回到起点,爬向另一条链接。
    广度优先是指蜘蛛在一个页面上发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有第一层链接都爬一遍,然后再沿着第二层页面上发现的链接爬向第三层页面。
    如图2所示,蜘蛛从A页面顺着链接爬行到Al,Bl, C1页面,直到A页面上的所 有链接都爬行完,然后再从A1页面发现的下一层链接,爬行到A2, A3, A4,……页面。

联系鹤翔网络
蜘蛛爬取网站的基本方式 https://www.24gx.cn/New-1055.html
返回到:seo密码 下一篇:常见的搜索引擎蜘蛛
建站百科
更多>>
盐城网站制作公司谈:高转化的产品页设计 2025-9-22
抛开"做一个网站多少钱",先理清需求与功能! 2025-9-19
盐城网站改版升级千万别乱动这几点!网站改版避坑指南 2025-9-19
外贸公司网站做好这7项工作,订单想不增长都难 2025-9-17
抛丸机厂家网站网站排名做上来的七大关键步骤 2025-9-17
盐城网站建设公司谈定制网站的重要性 2025-9-15
阿里云虚拟主机MIME配置教程 2025-9-15
WebP图片:让网站速度快人一步 2025-9-14
产品选型功能,企业网站转化利器! 2025-9-11
竞品体验分析:好网站设计的第一步! 2025-9-11
网站制作收定金,原来是为了对你负责! 2025-9-11
盐城企业找网站制作公司,应该怎么选? 2025-9-6
 
SEO密码 更多>>
如何让你的企业网站内容出现在DeepseeK的答案中 2025-9-22
盐城企业网站关键词排名提升|公司简介SEO优化 2025-9-19
盐城网站优化|关键词策划+网站诊断+内容创作指南一站式解决 2025-9-18
网站SEO优化中常被忽视的页脚设计 2025-9-18
盐城有没有一家能提供专业网站内容建设的公司? 2025-9-12
为什么企业网站必须设置资讯栏目? 2025-9-12
长尾词库:企业网络营销的隐形金矿 2025-9-6
关键词的分析与策划对于网站关键词排名有多重要? 2025-9-6
盐城网站建设公司为你解读JSON-LD主要文章类标注 2025-9-4
JSON-LD实体身份类标注解读 2025-9-3
JSON-LD有哪些核心内容类标注? 2025-9-2
JSON-LD是什么?盐城网站建设公司为你解读 2025-9-2

电话:18962085379 地址:盐城市盐南高新区新龙广场10号楼 网站地图 本站总访问量:
版权所有@盐城鹤翔网络技术有限公司是一家专业做网站的公司,承接网站建设,网站制作,网页设计及网站优化(seo),欢迎来电咨询!
苏公网安备 32090202000679号 版权所有 2008-2028 苏ICP备10220343号-5

189-6208-5379