网站地图(Sitemap)是SEO优化的一环,然而,初学者对于Sitemap的功用和功能可能存在一些误解和不确定性。究竟Sitemap对于网站的SEO有何帮助?你是否真的需要使用Sitemap呢?本文将深入探讨Sitemap的定义、製作方法,并延伸至SEO的相关知识和实战经验分享,相信对于正积极学习SEO的你会有所助益。
Sitemap的核心功能是什么?
「网站地图」指的是一个存放在网站上的档案,内容包括了所有网页、影片连结、图片连结等资讯。Google的爬虫会读取这个Sitemap档案,以便掌握网站中的各种网页。
从SEO的角度来看,Sitemap的主要功能在于「协助搜寻引擎瞭解网站中包含哪些网页」。例如,纽约时报的一个Sitemap档案中列举了各种网页的网址和更新时间(值得一提的是,Sitemap基本上是公开的,只要知道路径,我们就可以查看别人的Sitemap)。
你需要使用Sitemap吗?首先,理解内部连结的概念
总结来说:儘管Sitemap能够帮助搜寻引擎理解网站结构,但并不是每个网站都必需使用Sitemap。
若网站的「内部连结」结构已经规划完善,Google无需透过Sitemap也能準确理解网站的页面架构。换句话说,Sitemap只是一个辅助工具,内部连结才是SEO优化的重点。因此,在急于建立Sitemap之前,建议先瞭解什么是内部连结,再评估是否需要使用Sitemap。这也是我们想分享的重要概念之一。
▍内部连结
即指同一网站内不同页面之间的相互连接,这包括导览列、侧边栏、以及页脚等元素。根据Google官方文件和教学视频,搜寻引擎的爬虫透过网站上的「站内连结」来探索您的网站。换言之,爬虫会点选导览列、麵包屑、侧栏、甚至商品列表等连结,以发现并索引您的网站。透过解析这些连结,爬虫也能识别出各网页间的相互关联。
因此,在SEO优化中,优良的网站导览列、侧栏等动线设计至关重要。这些元素被称为「内部连结优化」,若网站的动线出现问题,Google在解析网站时可能会遇到困难。
此外,若您的网站中存在一些缺乏内部连结的页面(我们通常称之为「孤儿页面」),或者某些页面在网站内部的结构中过于深隐或难以到达(例如6年前发佈的较陈旧文章),搜寻引擎可能难以发现这些页面,进而影响网站的SEO表现。为了避免此类问题,确保Google能够有效地索引所有网页,我们可能会进行以下优化工作和检查:
检查网站的内部连结架构,如导览列、侧栏等动线设计,是否健全。
检查在现行的导览结构下,是否存在孤儿页面或者难以到达的页面。
提交Sitemap网站地图,透过Sitemap主动告知Google网站包含的页面。
换言之,为了让Google正确理解我们的网站,我们必须进行「内部连结优化」。而Sitemap仅是其中的一种辅助方法,真正的关键仍在于建立健全的内部连结结构。
▍那么,您的网站是否需要Sitemap呢?
许多人认为Sitemap在SEO中至关重要,但实际上并非必然。这取决于您的网站状况是否需要使用它。如果网站的「内部连结」结构已经规划完善,也没有孤儿页面或者过深、难以访问的页面,Google基本上能够準确理解您的网站。因此,您是否提交Sitemap对网站的SEO通常不会产生重大影响(其影响可能微乎其微,甚至在数据上难以感知)。
Google官方也针对需不需要使用Sitemap给出了几点建议:
可能「不需要」使用Sitemap的情境:
网站规模较小,页面数不超过500页。
网站内部连结结构完善,每个页面均有路径可达,没有孤儿页面。
可能「需要」使用Sitemap的情境:
网站规模较大,如果网站规模过于庞大,Google可能无法轻易找到所有页面,尤其是较新的页面。这时使用Sitemap能够加快Google发现和索引页面的速度。
网站刚上线,若网站刚刚上线且没有反向连结,Google会比较难发现您的网站,这时透过主动提交Sitemap是一个有效的方法。
网站包含大量媒体内容(如影片或图片),如果您希望您的网站在搜寻结果中显示影片、新闻、图片等内容,可以使用Sitemap提供给Google参考。
网站包含不同语言版本的页面,如果网站提供不同语言版本,例如英文、中文等,透过Sitemap可以告知Google相应语言版本的页面。
▍如何製作、提交Sitemap网站地图
由于本文主要着重于「透过Sitemap理解SEO优化概念」,因此在製作Sitemap一节中,我们只会简要介绍重点,使您了解Sitemap建立的流程和步骤。详细的製作方法可再参考Google官方文件。
製作Sitemap网站地图包含叁个步骤:选择格式、製作档案、提交。
步骤一:选择Sitemap格式
Google支援叁种Sitemap格式(这叁种格式均可使用,没有一种比其他更好),请根据您的网站状况和需求选择适合的格式。
1. XML Sitemap
XML的全名为「Extensible Markup Language」,是一种专为电脑设计的程式语言。
XML Sitemap是最常被使用和用途最广泛的格式之一。除了网址,它还可以提供图片、影片、新闻等资讯。大多数Sitemap产生器都提供XML Sitemap格式的档案。
2. RSS / mRSS / Atom 1.0
RSS的全名为「Really Simple Syndication」,它是一种用于整合多个网站更新内容的讯息来源格式。
「RSS / mRSS / Atom 1.0」的结构类似XML Sitemap,但档案通常较小且更新频繁。Google官方建议,如果您的网站更新频率很高(例如新闻网站或部落格),可以同时使用「RSS / mRSS / Atom 1.0」和「XML Sitemap」这两种格式,前者用于提供最新的更新内容,后者则提供所有网页的资讯,以提升Google抓取页面的效率。
3. 文字 Sitemap
文字Sitemap的格式最简单,只需要在txt文字档中列出网址即可。这是一种适合内容相对简单的小型网站使用的格式。
步驟二:製作Sitemap档案
製作Sitemap档案有叁种方法,请根据您网站的规模选择适合的方法:
1. 网站使用WordPress系统,使用外挂来产生Sitemap
若您的网站是使用WordPress系统建立的,那么这非常简单。市面上有许多插件可以协助製作Sitemap。如果您已安装了像「Yoast SEO」或「Rank Math」这样的SEO插件,启用Sitemap功能后就能自动产生网站的Sitemap档案。
如果您没有使用以上的WordPress SEO插件,您也可以在插件市集中搜索「Sitemap」,会有许多工具可供选择。
2. 网站规模较小,手动建立Sitemap
如果您的网站比较小,只有几十个页面,您可以直接使用文本编辑器手动建立Sitemap。
3. 网站规模较大,使用Sitemap产生器
如果您的网站页面较多,建议使用Sitemap产生器,这将会更有效率。推荐使用XML-Sitemaps.com,这是一个非常简单易用的工具,若您的网站页面少于500页,则可以免费使用。此外,也可以在Google中搜索「generate sitemap」,会有许多工具供您参考使用。
步驟三:向Google提交Sitemap档案
製作好Sitemap网站地图后,最后一步是将其提交给Google(这个步骤让Google知道我们网站上Sitemap档案的位置,但并不代表Google一定会下载该档案,或者透过Sitemap来检索您的网站)。
最简单的方式是透过Google Search Console的「产生索引 > Sitemap报表」,将步骤二中製作的Sitemap档案网址贴上并提交即可。
在Search Console的Sitemap报表中,您可以随时查看Google存取Sitemap的时间,以及是否成功检索档案。一般来说,Sitemap被Google顺利存取后,Google会定期回来检索Sitemap档案,因此我们无需重复提交Sitemap,只需定期检查状态是否正常即可。
Google官方已经明确表示,他们基本上不再考虑Sitemap中的网页变更频率(Frequency)和网页优先级(Priority)。因此,除非您的网站结构发生重大变动,否则不需要重新提交Sitemap档案。
Sitemap对于SEO有实质帮助吗?
对于Sitemap在SEO中的实际作用,我们可以从Google官方的说法中找到答案:
Google的John Mueller曾在Twitter上明确表示:Sitemap并不能取代内部连结。
此外,Google官方的文章也明确指出:Sitemap并不会直接影响您网页的实际排名,然而它能帮助更多网页被爬取。
Google的员工Gary Illyes也在推特上提到过,Sitemap不会直接影响您的网站排名。
总括而言,Sitemap的主要功能在于协助Google爬取网站,对于排名并无实质影响。真正改善SEO的关键在于「内部连结优化」。这就好比在一家大型卖场中,即使给了你一份地图,它仅仅是协助你找到路径,并无法解决卖场本身的迷路问题。若仅仅依赖Sitemap,而忽略了审视和优化网站内部连结和动线问题,很可能会导致SEO方面出现问题。
此外,Google也在YouTube上提及:仅仅因为Sitemap档案包含了大量网址,并不意味着我们会对其进行全面索引。
因此,若您的网站规模庞大,或者内部动线不完整,仅仅依赖Sitemap是无法解决您的SEO问题的。因为网站内部连结和动线对于爬虫来说是重要的信号,透过这些内部连结的架构,爬虫能解析出网页之间的关係。此外,这些内部连结还能传递权重,而「孤儿网页」即便透过Sitemap被Google爬到,也不会获得太多的SEO权重,因为孤儿网页缺少连结,也无法进行权重的传递。
简而言之,Sitemap并非SEO最关键的优化项目,不应将其视为解决SEO问题的主要途径。当然,您可以主动提交Sitemap,这就像提供了一罐能量饮料给Google一样,但如果您的网站结构健康,或者网页规模不大,Sitemap对您未必会有明显帮助(因为Google爬虫可以透过网站内的连结和动线有效解析您的网站)。因此,您可以将Sitemap的优先级降低,与其过度关注Sitemap,不如花更多时间研究其他SEO优化工作。
其他一些小知识:
知名的SEO工具品牌Moz以及SEO领域的权威专家Rand Fishkin在早期提出了一个有趣的论点,他指出提交Sitemap实际上既有好处也有坏处。坏处在于「您无法透过Google的收录情况有效找到孤儿网页」。换句话说,通过故意不提交Sitemap并观察Google的收录情况,实际上有助于我们诊断内部连结的健康程度。也就是说,我们应该识别出哪些网页未被健康地收录,这意味着这些网页可能是孤儿网页,或者连结的层级过深,内部连结并不健康。然而,Rand Fishkin后来表示,现在他会提交Sitemap,这个观点和做法我认为对于一定规模以下、健康的网站来说仍然是适用的。这可以帮助我们判断内部连结是否存在问题。然而,我们建议只有具有丰富实践经验的人才採取这种做法。
以上这些观点其实是一个比较早期的看法,虽然Rand Fishkin几年后表示他现在会提交Sitemap,但这种观点和做法对于一定规模以下、健康的网站来说仍然是适用的,它可以帮助我们判断内部连结是否存在问题。这种做法需要由具有丰富实践经验的人来採纳。
今天我想讨论的主题之一是「SEO学习」,在职场上我遇到许多刚开始学习SEO的人过于关注Sitemap。我也遇到许多初学者在接触SEO时,误以为Sitemap能像神奇丹药一样拯救他们的SEO,这让我想写下这篇文章。有些人过度强调Sitemap对SEO的影响力,但却未详细说明其功能,或深入研究Google官方的建议。
不仅仅是Sitemap,许多初学SEO的人在学习优化项目时未必会「釐清这些知识」。我认为在SEO中,优化项目实在太多了。在这个资讯爆炸的时代,SEO的学习者应该学会两件事:
学会诊断SEO的问题点,以及了解每个优化项目的功能。
可能导致你的SEO效果不佳的塬因有很多。以图中的两个环节为例,第一个环节是爬虫【爬取网站】的优化,第二个环节是【排名因素】的优化。学习SEO最困难的地方在于準确地诊断问题。如果Google在爬取你的网站时一切正常,那么针对爬取的优化效果将非常有限。反之,如果你的内容优质、网站权重高,但Google却无法爬取你的网页,那么应先解决爬取的问题。
网站结构没问题、网站规模不大、Google爬取顺畅,但内容品质不高、网站速度体验不佳,再怎么提交Sitemap都没有用。
Google爬不到网站,即使内容再优质、网站体验再好,Google也看不到你的网站,因此优化内容也将毫无成效。
一个问题发生在爬取,另一个问题则发生在排名因素的优化,因此后续的优化工作截然不同。这有点像医学,头痛固然是症状,但引起头痛的塬因多种多样,例如压力、失眠、肿瘤、自律神经失调,但仅仅吃止痛药并不能根治问题,应当找到根本塬因并从源头解决。
学会釐清哪些因素对Google具有较强的讯号以及影响力。
SEO优化项目众多,但我们有限的时间和紧迫的需求,所以在实践中我们会从对SEO影响较大、对Google讯号较强的优化项目着手。初学SEO时,我们应该明确哪些项目对影响力较大,哪些对成效影响较小。例如Meta Keywords、网址中的关键字、Title中的关键字等,这些都是比较过时或对SEO影响较小的优化项目。
以这篇文章的Sitemap为例,许多人以为它对SEO很重要,但实际上未必如此。如果你的网站内部连结健康或规模不大,Sitemap对效果不会太大。同时,Sitemap的重要性也不如内部连结高。许多文章会告诉你A优化项目很重要、B优化项目是趋势,但未必会告诉你「什么情况很重要」、「对于哪些网站很重要」、「重要在哪」、「是趋势的塬因是甚么」。在SEO优化中,网站架构、所属的产业、拥有的资源等许多因素都会影响我们的策略和优化手段。对于初学者来说,更应该细心、清楚地了解所有学到的知识,而不是盲目执行网路上的文章所说的重要性。
了解「What」很重要,但釐清「Why」才是成长的关键。
任何一个优化项目,釐清其功能和实际效果才是重点。确实有些网站需要透过Sitemap来解决网站SEO的问题,但也有许多网站不需要这么做(在我的经验中,甚至大多数的中小型网站并不一定需要)。