SEO 的 XML sitemap 站点地图终极指南
文章目录
什么是站点地图 sitemap
不一定要在 robots.txt 文件中放置站点地图,但它可以帮助大多数机器人找到它,包括 Google 和 Bing 以外的搜索引擎。例如,Seznam 和 Yandex 都可以从 robots.txt 读取站点地图指令。
为什么站点地图 sitemap很有用
- 在站点地图中包含页面并不能保证它会被编入索引,但它可以加快索引过程并使其对你来说更加可靠。
- 站点地图有助于优化抓取预算的使用情况。 没有它,搜索引擎机器人需要抓取你的整个网站以查找新鲜的、可索引的内容。因此,他们可能会浪费抓取预算访问低质量的页面,而忽略一些更有价值的页面。
- 当你将站点地图添加到 Google Search Console 时,你可以获得有关站点地图中 URL 的反馈。因此,如果某个页面有问题并且 Google 无法抓取它,你将通过查看 Google Search Console 中的覆盖率报告来了解它,并且你将有机会采取行动。
谁需要站点地图 sitemap
XML 站点地图可以帮助任何网站,为了安全起见,每个网站都应该有一个。尽管如此,它对某些人来说可能比对另一些人更有益。
如果满足以下条件,站点地图是绝对必须的:
- 你的网站有很多动态内容。 如果您经常更新页面,搜索引擎机器人可能会错过您的一些新内容或更新的内容。
- 你有一个大型网站(超过 500 个页面)。 你的网站越大,搜索引擎机器人可能忽略某些页面的风险就越大。
- 你有一个新网站。 不幸的是,新网站通常很少或没有外部链接。因此,爬网程序可能很难找到它们。
- 你有孤立的页面或内部链接不佳的页面。 如果搜索引擎机器人无法通过点击链接发现你的页面,则它们可能无法找到所有页面。
- 你有很多富媒体内容(图像、视频)。 站点地图允许你为搜索引擎提供有关您的视觉内容的其他信息(例如,视频播放时间、图像对象问题)。
站点地图 sitemap中应包含的内容
- 用 200 代码响应,
- 未被 robots.txt 阻止,
- 不要包含 noindex 元 robots 标签,
- 是页面的规范版本。
Sitemap 站点地图组成部分
https://www.example.com/page1
2024-11-01
weekly
0.6
https://www.example.com/page2
2024-11-03
weekly
1
?xml 和 urlse 标签
url 标签
- <loc> (必需)
- <lastmod>(可选)
- <changefreq>(可选)
- <priority>(可选)
loc 标签
https://www.example.com/page1
<loc> 标签代表 “location”,它包含页面的 URL。
需要记住指定站点协议(HTTP 或 HTTPS)。
lastmod 标签
2024-11-01
changefreq 标签
weekly
- always(指定每次访问页面时都会更改),
- hourly,小时
- daily,每天
- weekly,每周
- monthly,每月
- yearly,每年
- never 从不(应该用于存档页面)。
priority 标签
0.6
priority 标签直接让搜索引擎知道页面相对于你网站上的其他 URL 有多重要。在 0.0 到 1.0 之间的范围内分配优先级。
值得注意的是,Google 没有考虑这个标签。
Hreflang 标签
下面是一个包含英语和德语版本的页面示例。
https://www.example.com/page1/en
将 hreflang 标签添加到你的站点地图可以帮助搜索引擎向用户展示最合适的语言版本。但是,推荐的做法是将标签添加到你的 HTML 代码和站点地图中,或者仅在 HTML 代码中添加。
虽然将 hreflangs 放入 sitemap 中是有效的,但验证它们也使它们变得很痛苦。首先,许多 SEO 工具都针对 HTML 中的 hreflang 标签进行了优化。其次,你可以忘记任何浏览器插件,这些插件会在访问页面时自动为你检查 hreflangs。这仅适用于 HTML 中的 hreflangs。**如果你把标记放在站点地图中,所有这些便利都会丢失。**每次你希望看到对 hreflang 标签所做的任何更改时,你都必须抓取你的站点地图。
如果您也想做多语言网站,请联系Nat。
sitemap 站点地图扩展
- 图像
- 视频
- 新闻
XML 图像站点地图
- 你的网站依靠图片来吸引流量(例如,图库照片网站),
- 否则可能很难找到这些图像(例如,通过 JavaScript 获取的图像)。
XML 视频站点地图
Google 新闻 网站地图
Sitemap 站点地图索引文件
http://www.example.com/sitemap1.xml
http://www.example.com/sitemap2.xml
- 指定版本和编码标准的 XML 标头标签,
- sitemapindex – 文件周围的父标签(相当于 <urlset> 标签),
- sitemap – 包含每个 sitemap 文件的父标签(相当于 <url> 标签),
- loc – 指定站点地图 URL 的位置标签。
如何创建站点地图?
手动创建站点地图
自动创建站点地图
- CMS 或电子商务平台的原生功能
- 添加插件
- 第三方工具
由 CMS 或电子商务平台生成的站点地图
插件生成的站点地图
如果你使用的是像 WordPress 这样的 CMS,你可能需要一个插件来生成站点地图。我建议使用 Yoast SEO,因为此扩展程序使过程变得简单,并带有更多 SEO 功能。
第三方工具
许多第三方工具可以为你创建站点地图,例如 Screaming Frog 或 XML-Sitemaps.com。你必须先下载它,但之后,就像提供指向你主页的 URL 一样简单。
静态 vs. 动态站点地图
将站点地图提交给搜索引擎
你可以 ping 搜索引擎并让他们知道你有一个新的站点地图或对以前的站点地图进行了一些更改。
Google 不会在每次抓取网站时都检查站点地图;我们只会在第一次注意到站点地图时进行检查,之后只有在你 ping 我们告知我们站点地图已更改时才会检查它。仅在站点地图是新的或更新的站点地图时提醒 Google;不要多次提交或 ping 未更改的站点地图。——来源:谷歌
将站点地图提交到 Google Search Console
登录 Google Search Console 帐户。然后,转到侧边栏中的编制索引 > 站点地图。
Google Search Console 会通知您站点地图中是否有任何错误。
更多内容关于在google, bing, yandex中配置站点地图,请传送到:设置XML sitemap并添加到站长工具中
站点地图清单
- 确保你的站点地图的 URL 不超过 50,000 个。如果你有更多,请将其分解成更小的站点地图,
- 仅包含可编入索引的页面,
- 在 robots.txt 文件中引用站点地图,
- 使用一致、完整的 URL – 检查 URL 中是否缺少 www 或 HTTP/HTTPS 协议,
- 如果你有其他媒体内容(图片、视频、新闻),请使用 sitemap extensions,
- 如果你有不同的语言版本,你可以在你的站点地图中指定它们,也可以在你的 HTML 中使用 hreflang 标签。
- 不要太关注 changefreq 和 priority 标签,因为搜索引擎并不总是考虑它们。