社交媒体数据信息高是导致排名较好的缘故吗?
简单的说,这种排名因素统计的过程是这样:检索典型性关键字(数量需要达到一定量,例如1万只关键字),下载搜索结论页面(例如前2页或前10页),应用各种工具纪录、查看页面的特征(其实就是排名因素),剖析排名较好的页面有什么相同特点,或是有什么排名不好的页面所没有的特点,应用统计方式如皮尔森相关系数r(Pearson)或斯皮尔曼相关系数r(Spearman)计算出排名与排名因素之间的相关系数r。
因此,这类统计的基础是,“排名好”与“页面特点”同时出现,其实就是这两者有关联性,常常相关系数r还提高。但是关联性并不必然表明有因果性。最浅薄的比喻是,鸡打鸣和天亮常常一起发生,是很高关联性的,而且还是鸡打鸣后天亮,但鸡打鸣并不是天亮的原因。
排名与所谓的排名因素中间亦是如此。最明显的,绝大部分排名因素统计都表明,Facebook和Twitter等社交媒体里的点赞数、共享数、分享数等是和Google排名关联性最高的因素,换句话说二者同时出现几率非常高,但社交媒体互动交流数据信息高是导致排名较好的缘故吗?换句话说,是排名因素吗?一直以来,Google的几个员工都确立否定社交媒体数据是排名优化算法里的因素。
Google职工得话不一定都可靠,但社交媒体数据信息并不是排名因素,大部分是能够相信的。两个原因:
Google拿不到社交媒体里的详细数据信息。现阶段Google和好多个主要的社交媒体也没有协议书(之前和twitter有),不可以后台管理拿数据信息,只能靠自己抓。需要验证才能看到的信息当然抓不上,即便是不需要验证的,因为信息量太大,Google爬取的比例我记得以前看到过统计,还不到10%。
社交媒体随时都可以严禁Google抓页面。这个就更可怕了。不可以把握在自己手里的数据,用来做关键排名因素,一旦社交媒体们撕破脸皮,Google搜索结论品质很有可能直线下降。自己把品质管控权放到他人手上,大企业做不出这种事。
往往社交媒体数据信息较好的页面从而排名好,可能的缘故包含:
1.社交媒体数据信息绝对是排名因素(并不是必然,但是不清除这类很有可能)
2.检索排名好造成社交媒体共享数据信息好(逻辑关系是反过来的)
3.检索排名和社交媒体共享是另一个或一些一同因素造成的(例如页面访问量、外链数这类)
4.社交媒体互动交流间接性导致检索排名好
究竟是哪一种,或者其他因素,我们目前没法了解。
再比如,一个反过来的例子。Searchmetrics的统计说明,.com域名与排名是成反比,换句话说,.com域名不益于排名。这就有点难以相信了,一般来说.com域名全是优选啊。这很可能是被wiki百科强大的排名水平影响了,绝大多数查看词都是会有一两个wiki百科的页面排在前面,而它是.org域名。
再举一个中性化的例子。统计说明,排名较好的页面文本长短越来越长,那样文本长短是排名因素吗?或许是,也许不是,或许如今全部页面总长度都拉长了呢。
即然所谓的排名因素和排名中间不一定有逻辑关系,有些甚至确立并没有逻辑关系,那我们忙什么?这些企业费力统计它干什么呢?
最先,不一定有逻辑关系,但也不一定就没有逻辑关系。百度搜索引擎不用说,我们就不能确定罢了。每个统计调查中这么多因素,总会有一些绝对是搜索引擎使用里的排名因素,碰也可以遇上好多个。
更为重要,两者的强相关性通常是有本质原因的,尽管我们不知道准确关联。排名因素统计最少告诫我们,排名较好的页面都有什么特点。假如SEO们把一个页面提升得和排名较好的页面一个样,那样很大概率这一页面也能获得好排名,虽然我们也无法确立了解究竟提升的那一部分冒了功效,起了多大功效,究竟什么因素冒了功效也无所谓。
最终提一句,解决关联性、并非因果性的关系,恰好是人工智能的优势