众所周知,互联网上拥有着数量庞大的网页,数量之多难以想象。那么搜索引擎究竟是如何计算这些网页,并安排它们的排名呢?
举例来说,像淘宝网这样拥有上万个商家的宝贝,它们是如何排名的呢?哪些宝贝会被优先展示在前列?
每个搜索引擎的基本原理都是相似的,但在一些细节方面可能会有所不同,这也是为何使用不同的搜索引擎进行搜索会得到不同的结果的原因。
首先,搜索引擎会在本地建立一个数据库。建立了数据库后,数据从何而来呢?搜索引擎会派遣抓取机器人,通常称为“蜘蛛”,蜘蛛会在各个网站上爬行。蜘蛛会在爬行过程中进行信息的收集,将这些网页收入搜索引擎的数据库。随着数据库中网页的不断增多,蜘蛛在抓取时不会全部收集,而是根据多个因素进行选择,如原创度、是否存在相同网页等。此外,时效性、相关性、权重等也是蜘蛛在抓取时需要考虑的因素。
搜索引擎公司拥有大量工程师编写蜘蛛的抓取规则,同时也拥有大量服务器来存储抓取到的网页,将其存放在数据库中。这是一个庞大的工程,需要大量资源和技术支持。
无论用户在网络上搜索什么资料,搜索引擎都会在第一时间从数据库中找到用户需要的资料,然后进行排名展示。
排名的顺序会根据相关性、网站权重、影响力等多个角度来安排。
对于一些采用动态化程序的网站,甚至在页面源码中看不到链接,蜘蛛如何爬取呢?
搜索引擎会对蜘蛛抓取回来的页面进行各种预处理步骤:
提取文字;
中文分词;
去除停止词;
消除噪音;
正向索引;
倒排索引;
链接关系计算;
特殊文件处理。
除了HTML文件,搜索引擎通常还能抓取和索引以文字为基础的多种文件类型,如PDF、Word、WPS、XLS、PPT、TXT等。我们在搜索结果中也经常会看到这些文件类型。
虽然百度蜘蛛可能已经成功索引了我们的页面,但由于某些原因,蜘蛛还没有从数据库中释放我们网站被收录的页面。这时候千万不要急功近利,认为之前的努力都是徒劳的,然后寻求一些不正当的手段,比如使用黑帽SEO等。我们应该耐心等待,继续进行正常的网站优化工作,不久之后网页一定会被释放出来的。
用户在搜索框中输入关键词后,排名程序会调用索引库的数据,计算排名并展示给用户。排名过程是与用户直接互动的。然而,由于搜索引擎的数据量庞大,尽管每天都会有小幅度的更新,但一般情况下搜索结果不会有太大的变动。搜索引擎的排名规则根据不同阶段(日、周、月)会有阶段性的更新。
许多人误以为使用搜索引擎搜索时,可以获取实时内容,实际上并非如此。如果要搜索实时内容,搜索速度会非常慢。
做SEO也要明白这一点,搜索引擎是预先抓取网页的,因此要让蜘蛛勤劳地抓取网站,必须每天准备新鲜内容。
SEO领域中,我们常听到白帽SEO和黑帽SEO,它们分别采用了不同的优化策略,下面我们将对它们的常见手法和区别进行介绍。
▍黑帽SEO的常见手法
桥页和跳页:为了特定关键词的排名而设计的网页,通常不会在网站导航中出现,目的是引导用户访问网站的其他页面。举例来说,当你搜索某些关键词,点击一个网页后,却发现里面充满了注册引导或者跳转到其他页面的链接,这就是桥页和跳页的应用。
叠加关键词:这是一种常见于SEO新手的做法,比如在网页的标题中大量堆砌相同的关键词,比如:“网页推广,网站推广,推广网站,推广,网站”。这属于叠加关键词的做法。
隐藏文字:这是一种常用的欺骗方式,通常被一些黑客使用。他们会入侵某个网站,将文字的颜色和网页的颜色设置成一致,肉眼难以识别,只让搜索引擎看得见而让浏览者看不见。
极小文字:为了规避“隐藏文字”被惩罚,一些SEO从业者会将文字字体设置得非常小,甚至几乎看不见,通常会放在网页的顶部或底部。
障眼法:制作对用户无用或看不到的网页,其中堆砌了大量关键词,但搜索引擎却能识别。然而,搜索引擎对这种掩耳盗铃的做法会采取封锁措施。
网页劫持:通过某些工具下载一个网站的所有页面,然后复制到自己的网站上。然而,搜索引擎能够从多个方面来判断重复网页是否为原创,因此这种网页劫持方式逐渐减少。
链接工厂:这是一种通过大量网页互相交叉链接构成的网络系统。近年来,一些新的做法如“链轮(linkwheel)”和“博客群建”也涌现出来,介于黑帽与白帽之间,稍有不慎就可能被判定为黑帽SEO。
▍黑帽SEO的特点
站在黑帽SEO的角度,他们也有他们的理由。因为大多数黑帽SEO都采用程序化的方式,他们可以轻松地建立几万甚至几十万页的网站,只需释放他们的爬虫进行抓取。即使网站在几个月后被惩罚,他们可能已经赚取了数千甚至数百万美元的利润。对他们而言,投资回报率仍然相当可观。
站在白帽SEO的立场上,这种长期投入的策略,即使是正确的,有些人也可能不愿意采用。认真建设一个网站,涉及到内容创作、调研、流量分析以及与用户的交流沟通,有时会显得相当枯燥乏味。
▍白帽SEO的常见手法
白帽SEO起到了改良和规范网站设计的作用,使之对搜索引擎和用户更加友好,从而获取更多合理的流量。以下是一些常见的白帽SEO手法:
遵循搜索引擎规律,稳扎稳打:从网站框架、关键词、网站内容、外链等方面使用符合搜索引擎规律的手段,合理优化网站,提高用户体验,与其他网站合理互联,并持续不断地更新网站内容。
优化时间较长,效果逐步显现:白帽SEO需要较长时间,需要对网站的内容、外链等进行持续不断地更新。网站在展现效果、搜索引擎权重增长等方面增长速度相对稳定。
优化效果稳定,后期潜力巨大:白帽SEO优化的网站排名相对稳定,浮动不大,能够得到很好的流量。不用担心因SEO操作而降权。
▍白帽SEO的好处
你投入的时间和精力永远不会是无用功。不会立竿见影,但质变需要量变。
白帽SEO能够建立一个能够长远发展的公司,而黑帽永远只能是打酱油的。
白帽方法你是可以公开的,不用担心被人抄袭而超越你。而黑帽方法你得藏着。一个是练内功,一个是学外功。你懂的。
优质原创的内容总是受用户欢迎,制造垃圾信息总是会让人反感。
白帽是帮你建立一个品牌的网站,用户需求稳定,你不用担心搜索引擎排名不稳定。
白帽的方法做的是一份事业,人不能没有长远的眼光!
白帽SEO是一种公正的手法,是使用符合主流搜索引擎发行方针规定的SEO优化方法。它是与黑帽SEO相反的。白帽SEO一直被业内认为是最佳的SEO手法,它是在避免一切风险的情况下进行操作的,同时也避免了与搜索引擎发行方针发生任何的冲突,它也是SEO从业者的最高职业道德标准。