最近Alexa网站排名在国内互联网界引起了不小的震荡,除了互相竞争的揭露以外,对Alexa排名机制的详细解剖和反思成为另一个热点。毫无质疑,中国互联网发展到今天,人们对于排名、浏览量等数据已经非常关注,而且一定程度上也成为互联网业内互相评判的依据,成为网站获取广告和投资的重要卖点。然而,当人们开始质疑被视为权威的Alexa 数据时,当国内各种排名发布、数据统计日益增多时,我们该相信谁的数据呢?
部分国内网站因私利造假 Alexa数据开始受到质疑
作为一个国际互联网站的数据监测和统计站点,Alexa自从进入中国互联网人视野以来,就被视为公正、权威的象征。中国的网站纷纷加入Alexa网站监测行列,以此来衡量自己网站的位置,业界更是将其视为评测中国网站的权威,各家网站纷纷采用Alexa的数据来说明自己的实力。一些网站还以此数据为基础进行中国网站的排名和监测,并努力试图将其推举为中国的行业标准,比如:互联网实验室的CIIS指数,就是以ALexa 数据为基础的一种算法,实时免费地向公众发布国内网站的监测和排名信息。
然而,近期由于知名网站Alexa数据的剧烈变化,人们方才开始质疑这个被视为权威的"世界著名的第三方测评机构"。其实,早在Alexa进入中国最初,就有文章对其排名机制进行了解析,从这种机制本身而言,就无法排除"作弊"。前几年,某韩国网站Alexa世界排名的骤升,就曾引起过一些人的怀疑。可以说,有些网站挖空心思对Alexa数据"作弊"在中国也一直存在,只是此次由于发生在知名网站,所以才引起如此大范围的关注而已。
自从Alexa受到国人关注,国内研究Alexa排名机制的人就一直存在,而且关于如何提升排名等的小技巧也在网上广为流传。国内互联网界越是将Alexa视为权威,如何在Alexa中获得一个好的位置也就备受各网站的重视,关于如何提升Alexa排名的技巧专研也就越专业,因此,此次事件只是众多事件的一个偶然,只是由于网站本身的知名度使得可能存在的Alexa"作弊"放大。
此事的意义在于由此引发的国人关于网站统计数据的反思和广泛的讨论。人们从对数据的简单关注和盲目崇拜,走向质疑数据、寻找数据的依据、考察数据的来源。
除了Alexa,我们还能依赖谁?
中国互联网发展到今天,细分市场、准确的市场定位已经成为网站赢利甚至生存的必须。即使综合门户网站也不得不在众多的服务中寻找自己最有利的赢利点。因此,通过详细、可靠的网站数据分析和统计,找到网站的真实用户,挖掘网站可能的目标用户,已经成为各网站非常关注的事。很多网站为此专门设置了数据挖掘部门,或者由相关部门承担数据挖掘工作,对自己网站的访问情况和用户行为进行跟踪分析,以此不断地调整网站的内容和定位。然而,对于网站赢利来说,更为关键的是,通过找准实际的用户,才能更加有效的进行广告的有效投放和吸引。
通过数据挖掘,各家网站内部对自己的数据可能有所了解,然而,整个行业的情况是什么样却难以掌握。不了解整个行业,不仅大的定位和部署难以有的放矢,而且也极大的限制了新服务和产品的开发。因此,国内也出现了一些专业的互联网数据监测、评估站点和机构,以独立的、第三方的角度进行数据采集与分析,并通过大量数据的累积进行行业的数据发布和预测。
当前,国内比较流行的网站监测和评估网站从基本机制上主要可以分为两类:一类是类似于Alexa的,基于客户端的统计。一类是基于被统计对象的网页统计。前者一般是通过工具条、主动加入等方式,从网民的客户端访问记录来进行数据的搜集和统计。这种统计机制与Alexa存在着同样的缺点,比如:作弊漏洞、用户信息极其模糊等系统问题。当前国内大部分的公开统计数据多是通过此种方式获得的,比如:互联网实验室、艾瑞等网站发布的信息。后者则是通过在被统计的网站页面嵌入相应的代码,来获取网站被访问的各种细致信息以及网站真实的访问者信息。由于这种方式可以详细定位于网站的任何部位,因此所获信息细致可靠。大部分网站自己设计的数据挖掘部门大部分都是采用这种方式,另外也有专门从事这种详细数据搜集和分析的专业公司,比如:北京缔元信互联网数据技术有限公司的万瑞数据。

【图1】万瑞数据的产品服务之一:提供网站独立访问者和浏览量日趋势图
然而,正如前面提到的那样,各家公司自设的数据挖掘部门的数据,各自有各自的标准,各自有各自的统计方法,各自有各自的用途和目的,而且被企业视为机密,因此数据虽然详实可靠,却不利于对行业情况的了解和评估,不能为业内所共享和开发,也不利于整个行业的监测,尤其对于广告商是不透明的。缔元信公司的万瑞互联网数据平台提供的专业数据的采集,在保证单个对象数据保密的基础上,通过第三方数据的长期积累,有可能逐渐勾勒出行业的整体面貌,使业界受益。毕竟,第三方监测机构,在国内发展时间短,各家的指标和标准难以统一,数据来源和统计方法各不相同,因此很难形成业界公认的标准和权威,而且对于一些机构也难以排除商业运作(比如竞价排名)的可能。这也是国内网站很大程度依赖Alexa数据的原因之一。