推广

我来分享网站抓取有哪些问题,怎么解决。

iseeyu3年前 (2023-12-01)推广126

当您面对大型可能遇到的上千个潜在问题时,您从哪里开始解决,这是我们在重建网站抓取时尝试解决的问题。 答案几乎完全取决于您的网站,并且可能需要对其历史和目标的深入了解。

简单的操作有时是危险的,为什么?

以前,我们试图将网站初期的每个问题标记为高,中,低优先级。 这种简单的方法可能是有用的,但我们发现不能这样做,你可能会想知道为什么我们离开它。

首先,网站优化要素优先次序取决于您的意图。 如果搜索引擎在进行网站抓取的时候,误解你的意图可能会导致不好的结果,从混乱到彻底的灾难性的。 比方说,我们在Moz上聘请了全新的seoER,发现网站存在以下问题:

一、网站同时存在几乎35,000个NOINDEX标签

如果采用搜索引擎优化工具赶紧删除这些标签,那么网站本身会受到很大的伤害,而不是意识到绝大多数这些指令是有意的。 我们可以让我们的系统更聪明,但是他们看不懂,所以我们要对虚警报警谨慎。

二、其次,优先考虑的问题并不能帮助您了解这些问题的性质或如何解决这些问题。 我们现在将网站抓取问题分为四种描述类型之一:

历史数据问题

重定向问题

元数据问题

内容问题

三、按类型进行分类可以让您更具seo技术。 例如,我们新的“重定向”类别中的问题将会有更多的共同点,这意味着它们可能有共同的修复。 最终帮助您找到问题只是第一步。 我们希望能够更好地帮助您解决问题。

1.从严重的爬虫问题开始

这不是说一切都是主观的。 一些问题阻止抓取工具(不仅仅是我们的,而是搜索引擎)到达你的页面。 我们将这些“关键爬虫问题”分组到我们的第一类,目前包括5XX错误,4XX错误和重定向到4XX。 如果您在5XX错误中突然上升,您需要知道,几乎没有人有意将其重定向到404。

您会看到整个网站抓取界面中突出显示严重的爬网程序问题:

寻找红色的警报图标来快速找到关键问题。 首先解决这些问题。 如果无法抓取页面,那么每个其他抓取工具的问题都是无法解决的,对seo是极为不好的。

2.平衡流行率的问题

在解决您的技术性SEO问题时,我们还必须平衡严重性与数量。 不了解你的网站,我会说404错误可能值得在重复的内容之前解决 - 但是如果你有十一个404和17,843个重复的页面呢 你的优先事项突然看起来很不一样。

我们已经为你做了一些seo数据分析,通过问题的普遍程度来加重紧迫性。 这需要对优先级的一些假设,但如果您的时间有限,我们希望至少为您提供解决几个关键问题的快速起点。

3.解决多页问题

解决高额问题的另一个优点是。 在许多情况下,您可以通过一次修复来解决数百个(甚至数千个)页面上的问题。 这是一个更加战术的方法可以为您节省大量时间和金钱的地方。

比方说,我想在Moz.com上挖掘916页,缺少元描述。 我马上注意到,其中一些页面是博客文章。 所以,可以通过URL过滤解决网站抓取问题:

我可以很快看到,这些页面占我缺少描述的392个,高达43%。 如果我担心这个问题,那么可能我可以通过一个相当简单的CMS页面解决它,用几行代码擦除数百个问题。

在不久的将来,我们希望为您做一些这样的分析,但如果过滤不能完成此工作,您还可以将任何问题列表导出到CSV。 然后,转动和过滤到你的心脏的内容。

4.通过PA和爬行深度潜入页面

如果您不能轻易找到明确的模式,或者如果您已经解决了一些重大问题,那么下一步呢 一次修复数千个问题一个URL只是值得的,如果你知道这些URL很重要。

幸运的是,您现在可以按页面权限(PA)和网站抓取中的抓取深度进行排序。 PA是我们自己的排名能力的内部指标(主要由链接权重判断),爬网深度是页面与主页的距离:

在这里,我可以看到我们的MozBar网址中有一个重定向链,这是一个非常高权限的页面。 这可能是一个值得修复的问题,即使它不是一个明显的,更大的组织的一部分。

5.注意网站抓取中出现的突发问题。

最后,随着时间的推移,您还需要注意新问题,特别是如果网站抓取问题同一时间大量出现的情况。 这可能表明突然和潜在的破坏性变化。 网站抓取现在可以轻松跟踪新问题,包括警报图标,图表和按类别的新问题的快速摘要:

任何爬网都会发现一些新的页面(内容机器永远不会休息),但是如果您突然看到数以百计的单一类型的新问题,重要的是迅速挖掘,确定没有任何问题。 在一个完美的世界中,SEO团队总是会知道其他人和团队对网站的改变,但我们都知道这不是一个完美的世界。

扫描二维码推送至手机访问。

版权声明:本文由西安泽虎代运营发布,如需转载请注明出处。

转载请注明出处https://www.0291.com.cn/post/122887.html

相关文章

小编分享seo网站优化友情链接有什么具体作用。

小编分享seo网站优化友情链接有什么具体作用。

seo网站优化中大家都不陌生,这是最常见的推广方法之一,友情链接操作方式很简单,两个网站相互进行链接,即完成.但是千万不要被它简单的外表所迷惑,想做好它,并不容易.首先让我们了解在友情链接作用,如果不明确作用,就无法把工作做好。 提升PR 我们如何判断自己的网站达到了什么级别标准...

教你SEO外链专员如何选择优质的外链。

教你SEO外链专员如何选择优质的外链。

随着搜索引擎算法的不断调整,页面排名出现很多因素,搜索引擎所考量的指标,越加多元化,那么现今作为一名seo外链来说,应该从哪些方面评估一个外链是否足够优质呢?下面小编小编给大家说说外链的18个考量因素,希望对大家有所帮助! 1.锚文本 重要性: 之所以锚文本只拿到三颗星的原因,是...

【实践】这些MySQL索引优化方法真牛X,用了效率蹭蹭涨

【实践】这些MySQL索引优化方法真牛X,用了效率蹭蹭涨

索引的相信大家都听说过,但是真正会用的又有几人?平时工作中写SQL真的会考虑到这条SQL如何能够用上索引,如何能够提升执行效率? 此篇文章详细的讲述了索引优化的几个原则,只要在工作中能够随时应用到,相信你写出的SQL一定是效率最高,最牛逼的。 文章的脑图如下: 图片 索引...

RFID是全渠道销售的解决方案

RFID是全渠道销售的解决方案

在介绍全国零售联合会(NRF)上比格·肖提出了关于零售信息系统(RIS)。在2017年,无线射频识别技术在几个主要的零售报告和事件强调了RFID被认为是可以支持全方位销售策略的技术,让公司将在线和实体销售进行组合,而且不会失去对产品流动的控制,可以从这些交易中获取重要...

SEO的第一步程序。

SEO的第一步程序。

我做seoer,有段时间了,从做时错误的认为“内容为王,外链为皇”的优化手法,到一步步摸索学习,总结经验。不再盲目的操作,重复”无意义“工作,到现在感觉其实seo很好做。为什么?原因是我在做前分析考虑的周全,分享一下我做seo前的第一步——数据分析。 一、分析用户所需要 1、利用百度...

高中物理题,什么时候用能量守恒解题更简单,什么时候用 ...

从使用条件上来说,动能定理要比机械能守恒定律要广,无论物体受到什么力、运动过程有多么复杂,动能定理都可以使用。但是机械能守恒定律必须满足只有系统重力或者弹力做功这个条件时才能使用。所以从这个角度来说,肯定优先考虑使用动能定理。从对象上来说,如果只是单个物体,动能定理肯定也是...

现在,非常期待与您的又一次邂逅

我们努力让每一部企业宣传片和抖音短视频成为商业大片