如何在 Google Search Console 中修复“已抓取 - 当前未编入索引”
要解决 Google Search Console 中“被抓取但当前未编入索引”(crawled but currently not indexed)的页面问题,你可以按照以下步骤操作:
1.提高内容质量:
确保你的内容是高质量的、独特的,并为用户提供价值。它应该满足用户的意图,并与你的受众相关。
2.执行手动索引检查:
也许你的网页过去曾被编入索引,但 Google 现在已经将其删除。如果是这种情况,请单独查看受影响的网页,你可能会找到原因。
3.优化网站架构,使用内部链接:
确保你的网站结构清晰且导航正确,因为糟糕的架构会影响索引。链接到你网站上重要网页的内容,以向 Google 表明该内容很有价值。
4.摆脱重复项:
谷歌讨厌重复的内容。如果你的网站受到它的影响,请确保删除或优化它。
5.请求重新索引:
使用 Google Search Console 中的网址检查工具请求重新抓取该网页。
6.使用临时站点地图或验证网址:
考虑使用未编入索引的网址创建一个临时站点地图,并将其提交到 Google Search Console。你还可以请求验证“已抓取 – 当前未编入索引”报告。
文章目录
如何修复“已抓取 - 当前未编入索引”——6 个简单步骤!
对于为什么给定的页面被抓取但未被索引,谷歌没有给出明确的答案,但有几个可能的原因会导致状态出现。
使用以下步骤了解如何解决此问题。
第 1 步:提供高质量的内容
内容问题是“已爬网 – 当前未编入索引”报告的主要原因。
作为网站所有者,你应该确保您的页面提供高质量的内容。 检查它是否满足用户的意图,并在需要时添加高质量的内容。 Google 搜索中心提供了一系列问题,可帮助你确定内容的价值:
此外,你可以使用 Google 质量评分者指南中有关质量内容的提示。尽管该文档主要面向搜索质量评估者,但网站管理员可以使用它来获取有关改进其网站的见解。要了解更多信息,请查看我们关于质量评估器指南的文章。
另一个需要关注的方面是优化你网站上用户生成的内容。
假设你有一个论坛,有人提出了一个问题。尽管将来可能会有很多有价值的回复,但在抓取时还没有,因此 Google 可能会将该页面归类为低质量内容。
请记住,Google 无法索引 Internet 上的所有页面。它的存储空间有限,因此需要过滤掉低质量的内容。
第 2 步:对受影响的页面执行人工审核
URL可能会受到“已抓取 – 当前未编入索引”状态的影响,因为它过去曾被编入索引,但Google决定随着时间的推移取消索引。
如果你想知道为什么,很可能是:
- 索引选择,虽然它主要与 (RAM/闪存/磁盘) 空间有关,但它与内容质量密切相关。如果我们有大量的可用空间,我们更有可能索引更糟糕的内容。如果我们不这样做,我们可能会取消索引内容,以便为更高质量的文档腾出空间。——来源: Gary Illyes
- 受推出的新算法的影响,
- 由 Google 方面的错误引起。
不要以为一旦网页被编入索引,你就不需要再次对它做任何事情。
随着时间的推移,Google 可以改变评估你的内容的方式。
可能由于错误,你的内容已被部分删除。或者产品描述发生了变化,新的产品描述不符合 Google 的标准。
这比你想象的更常见。
检查你的内容并比较最新版本 – 如果有什么变化,你必须知道。这可能是 deindexing 背后的原因。持续监控你的页面并在必要时实施改进。
要轻松监控你的索引覆盖率,请使用 ZipTie – 技术 SEO 和索引智能平台。ZipTie 可让你监控索引延迟,并每周更新已删除索引的内容量。然后你您将知道是否需要人工审核。
解决问题后,你可以将分析过的 URL 提交到 Google Search Console,以帮助 Google 更快地注意到更改。
第 3 步:改进您的网站结构并改善内部链接
你的网页可能滞留在“已抓取 – 当前未编入索引”报告中的另一个原因是网站结构不佳。
良好的网站架构是最大限度地提高您被索引的机会的关键。它允许搜索引擎机器人发现你的内容并更好地了解页面之间的关系。
这就是为什么提供良好的网站架构并确保有指向你想要被索引的每个页面的内部链接至关重要的原因。
让我们想象一下这样一种情况:你有一个高质量的页面,但谷歌只能通过站点地图找到它。
谷歌可能会查看该页面并抓取它,但由于没有内部链接,它会认为该页面的价值低于其他页面。没有语义或结构信息来帮助评估页面。这可能是谷歌决定专注于其他页面并在抓取后将此页面排除在索引之外的原因之一。
如果您在进行内部链接方面遇到困难,请考虑访问我们的技术性SEO服务。
第 4 步:限制重复内容
重复内容是另一个问题,使Google停止索引你的页面。
你应该确保创建原始页面。
谷歌希望提供独特而有价值的内容。这就是为什么当某些页面相同或几乎相同时,它可能只索引一个。
不幸的是,重复的内容可能是不可避免的(例如,你拥有移动和桌面版本)。你对搜索结果中出现的内容没有太多控制权,但你可以向 Google 提供有关原始版本的提示。
如果你发现索引中有大量重复内容,请评估以下元素:
- 规范标签:这些 HTML 标签告诉搜索引擎哪些版本是原始版本。
- 内部链接:确保内部链接指向您的原始内容。谷歌可能会将其用作哪个页面更重要的指标。
- XML 站点地图:确保你的站点地图中只有规范版本。
但请记住,这些只是提示,Google 没有义务遵循它们。
如果 Google 忽略了你的 canonical 标签,你可以通过 GSC 中的 “Duplicate, Google chosen different canonical than user” 状态来发现它。
例如,SEO 自由职业者 Adam Gent 与 SEO 社区分享了一个有趣的案例。他的页面被报告为 “已抓取 – 当前未编入索引”,因为 Google 认为这是一个重复的页面。
目前尚不清楚为什么谷歌会选择“已抓取 – 当前未编入索引”,而不是重复内容的专用状态。一种可能的解释是,在 Google 决定是否有更适合该页面的页面后,状态会发生变化。
另一个选项可能是报告 bug。Google 可能只是在分配状态时犯了一个错误。不幸的是,这种情况更具挑战性,因为 “Crawled – Currently Not Indexed” 不会为你提供与重复内容的专用状态一样多的信息。
第 5 步:手动向 Google 提交请求,以重新抓取你的特定网址。
如果你解决了所有这些问题,则可以重新提交你的网页以供编入索引。
为此,请转到 URL 检查,输入 URL 地址,然后点击 请求编入索引。
你也可以尝试第二种更自动的方式。转到 → 页索引 → “已抓取 – 当前未编入索引”。
第 6 步:使用临时sitemap.xml
有时,重定向的目标 URL 等页面会出现在 “Crawled – Currently Not Indexed” 报告中。这不是由于重定向不正确,而是与 Google 抓取您网站的频率有关。你可能会注意到 Google 抓取了这些目标 URL,但并未将它们添加到其索引中。
一个可能的解决方案包括创建一个临时sitemap.xml文件。首先从 “Crawled – Currently Not Indexed” 报告中提取所有 URL,并使用 Excel 或 Google 表格将它们与已建立的重定向保持一致。
然后,生成一个站点地图,这可以使用 XML Sitemaps 等工具完成,并将其上传到你的 Google Search Console 仪表板。
“已抓取 – 当前未编入索引”与“已发现 – 当前未编入索引”
“已抓取 – 当前未编入索引”状态通常与“索引覆盖率(页面索引编制)”报表中的另一个索引问题相混淆:“已发现 – 当前未编入索引”。
这两种状态都表示该页面未编入索引。但是,在“已抓取 …”Google 已经访问了该页面。与此同时,在“已发现…”该 URL 为 Google 所知,但由于某种原因尚未被抓取。
这些状态的一些原因可能相似,包括页面质量差和内部链接结构问题。但是,当你看到“已发现…”状态,你还必须调查 Google 无法访问或不想访问该网页的原因。例如,它可能表示整个网站的整体质量存在问题、抓取预算问题或服务器过载。
查看这篇文章以了解更多信息: 如何修复 Google Search Console 中的“已发现 – 当前未编入索引”
结束语
“已抓取 – 当前未编入索引”主要与页面质量有关,但实际上,它可能表明更多问题,例如令人困惑的网站架构或重复的内容。
以下是可以帮助你处理 “Crawled – Currently Not Indexed” 状态的关键要点:
- 为你的页面添加独特且有价值的内容。完成后,将这些 URL 提交到 Google Search Console。这样,Google 可能会很快注意到变化;
- 审查你的网站架构并确保有指向你有价值的页面的内部链接;
- 决定哪些页面应该和不应该被索引,以帮助 Google 优先考虑最有价值的 URL;
- 实施临时sitemap.xml(有助于解决 301 重定向的目标 URL 问题,这些重定向已被 Google 编入索引但尚未编入索引)。
如果你需要帮助解决你网站上的 “已抓取 – 当前未编入索引 ”状态,我们的技术 SEO 服务就是你正在寻找的。