在网站日常运营中,失效链接是难以避免的问题,可能由于服务器地址变更、编辑错误、程序员疏忽、外部链接问题、爬虫提取不完整的URL、网站改版等原因导致。失效链接不仅影响用户体验,还会对搜索引擎评分、爬取频率和网站用户造成不良影响。在这篇文章中,我们将通过SEO网络营销的教学经验总结,为你提供处理失效链接的正确方法。
失效链接对搜索引擎的影响
评分影响: 失效链接率过高会影响搜索引擎对网站的整体评分。
爬取频率限制: 爬虫每天对网站的抓取频率有限,大量失效链接影响页面的抓取和收录。
用户体验降低: 过多的失效链接对网站用户来说也是不好的体验。
失效链接的产生原因
内部错误链接: 网站内部添加了错误的内部链接。
编辑失误或程序错误: 编辑错误或程序员疏忽导致页面产生不存在的链接。
短暂无法访问: 由于服务器、空间或程序问题导致网站短暂无法访问,出现大量5开头的服务器错误页面。
外部链接问题: 用户或站长在外部发布了错误的URL,其他网站复制或采集了包含错误链接的页面。
爬虫提取不完整的URL: 个别爬虫在提取页面URL时,由于URL中包含不规则字符或与后面的文字连接,导致URL失效。
网站改版: 网站改版后,老页面被直接删除,导致大量失效链接。
管理员删除页面: 网站管理员删除被黑、广告、过时或灌水页面导致许多失效链接。
如何发现失效链接
站长工具抓取异常: 使用站长工具查看最近一个月产生的各种失效链接,支持导出功能。
使用链接检查插件: 使用相关的链接检查插件,然后通过站点的收录地址进行查询。
记录删除的页面: 在网站运营中,特别是论坛,经常需要删除某些页面时,一定要记录相应的URL以便后期提交失效链接。
通过以上方法提取的失效链接列表,务必经过去重和验证,例如使用WPS表格进行删除重复链接,然后使用HTTP状态批量查询工具验证是否确实是失效链接。
正确处理失效链接的步骤
1. 网站改版的处理: 网站改版前的有价值页面尽量不要删除和修改URL,若需要更换域名或URL分配规则,一定要将之前的URL进行301重定向到对应的URL;若老的数据必须删除,那删除的所有页面URL要进行整理和提交失效链接。
2. 发现失效链接的处理:
新建一个txt文档,将所有的失效链接复制到文档中。
将文档上传到网站的根目录。
在站长工具中找到网页抓取 -> 失效链接提交 -> 新增数据 -> 填写失效链接文件地址(如bbs.seo.com/xxx.txt)。
同时需要使用robots.txt屏蔽失效链接,以避免爬虫抓取低质量页面,提升高质量页面的抓取。
注意事项:
提交的失效链接中不能存在活跃链接,必须返回状态码404。在站长工具中提交失效链接前,一定要确保提交的失效链接数据不存在活跃链接,存在活跃链接会导致提交失败。
由于很多网站程序问题,许多打不开的页面返回码并非404,这是一个大问题。确保找出所有错误URL格式,并将HTTP状态码设置为404。
找到所有错误页面后,要寻找此类页面URL的相同特征,并与正常页面的特征区分开,将相应规则写入robots文件中,禁止爬虫抓取。即使在站长工具中提交了失效链接,也建议在robots中封禁抓取。
通过这些措施,可以提升用户体验,减少跳出率,确保搜索引擎不会索引低质量页面,同时有效防止失效链接删除后,快照仍然存在的情况。