摘要:在本次研究中,本文首先对统计学分析和大数据分析的相关概念进行了系统化的阐述,讨论了统计学分析和大数据分析这两种方法之间的共性,并探讨了将统计学相关理论运用于大数据关系中的可行性。最后,结合具体的案例具体阐述了统计学理论在大数据分析当中的运用,以供参考。
关键词:统计学理论;大数据分析;实践行为
在如今信息化时代,许多交易都从线下发展到了网络平台,相应的交易过程中所产生的数据信息也都得到了有效的保留,而“大数据”技术就是针对这些得以保留的数据信息进行有效的分析,进而挖掘出隐藏在数据信息背后的规律,从而实现对事物未来发展趋势的预测[1]。而统计学分析在一定程度上和大数据分析之间存在诸多的共性,基于此,笔者在本次研究中主要针对统计学理论在大数据分析中的应用相关问题展开论述。
一、统计学分析和大数据分析的概念
1.统计学分析的概念
统计学作为数学学科中的一个分支,其主要作用是对数据进行有效的采集、分析以及解释,最终构建起数据分析模型,以便为实践活动提供必要的指导。通常,利用统计学分析工具,可以有效将隐藏在数据信息背后的规律提取出来,以便实现对事物未来发展的方向进行有效的预测[2]。具体,在进行统计学分析时,主要包括数据采集、统计分析以及构建预测模型。其中数据的采集方式主要有两种,分别为普查和抽样调查,普查就是针对所有的数据进行分析,而抽样调查则是从数据整体中随机抽取一部分作为分析的对象[3]。数据的统计分析就是针对所采集的数据资料进行系统化的数理分析,从而最终总结归纳出隐藏在数据资料背后的规律性的东西。而所谓的构建预测模型,便是依据之前统计分析得出的数学规律来进一步构建理化模型,以便对事物未来发展的趋势做出判断。总体而言,统计学分析的过程也是一个利用已知来推断未知的过程[4]。
2.大数据分析的概念
如今,伴随着各种交易形式的网络化,“大数据”这一概念在商业界及学术界显得炙手可热。大数据又称巨量资料,具体指的是以多元形式,自许多渠道搜集而来的庞大数据组,其往往具有实时性。这些数据可能来自社交网络、电子商务网站、政府、金融机构等平台。概括而言,大数据一般具有规模大、多样化、动态化、处理速度快及蕴含有巨大的商业价值等基本特征。基于大数据的基本特征,就要求我们所使用的设备能够从繁杂的数据信息中挖掘提取出对我们有价值的信息,从而实现对数据信息的有效利用。
二、统计学分析和大数据分析的关联性分析
1.统计学分析和大数据分析内在逻辑的关联性 在数据分析方面,传统的统计学相关理论主要利用的是数理分析工具以及概率论的相关理论来挖掘数据背后的规律,进而构建数学模型预测模型。与之相对的,大数据分析则是利用计算机技术,来对数量庞大的数据群进行整合分析,从而最终挖掘出隐藏在这些数据背后的根本性的规律,进而对人们的实际生产活动产生实际的指导性作用。和传统的统计学分析相比,基于计算机技术的大数据分析过程在数据分析方面显然更为完备。因为在进行数据分析的时候,很多时候会限于人为因素,而必须舍弃一部分数据,即采用抽样的方式来获取一部分代表性的数据并对其加以分析,而这个过程中间可能会遗漏某些重要数据,而导致最终分析得到的结果存在偶然性误差,而采用大数据分析则可以有效避免这一弊端。但是无论是统计学分析,还是大数据分析,其本质上都是通过对数据资料的挖掘,而或缺规律,来进一步构建起预测模型的,因此两种分析方法的内在逻辑是一致的。
2.统计学分析和大数据分析所采用方式的一致性
无论是进行数理统计分析,还是大数据分析,其分析的对象都必须是定量的数据形式,而不可以是一些抽象的事物。因此,在两种分析方法的数据获取阶段,都必须要将所获取的原始信息形式进行必要的转化,最终形成一种可以制表的量化数据形式。因此,统计学分析和大数据分析两种方式在所分析的数据形式的层面上是一致的。
三、将统计学理论应用于大数据分析的可行性分析
通过上文的相关阐述,我们可以指导經常提到的“大数据”分析,也是利用现代的技术手段及数理统计原理,对人们在网络交易中所产生的海量数据进行有效的分析的,从而最终构建起一个能够对人们的实际生活产生指导性作用的模型。因此无论是从逻辑层面来看,还是从结果来看,统计分析和大数据分析的实践应用之间都具有一致性。同样,统计分析也可以有效运用于大数据分析之中,既往大数据分析的相关研究发现,在进行面对海量的数据信息进行分析的时候,不能够盲目的采用随机分析的方法,这样会使得数据分析工作变得缺乏头绪,从而最终使得数据中有效信息提取的难度大大增加。一般而言,大数据具有价值、多样、高速、大量四个方面的特点。基于大数据分析的特点,既往相关专家总结出了如下公式,即:大数据一高频海量数据十复杂类型的数据。这也在一定程度上启发我们在进行大数据分析的时候,可以将一些数据指标量化,即将一些本来看似抽象的指标用数据的形式来进行表达,从而最终构建起数学模型,并对所构建起的数学模型进行演绎推理,以使得隐藏在数据背后的规律得以呈现,进而更好地指导实践行为。
四、统计学理论在大数据分析中的应用案例分析
1.统计学中的“大数定律”
比如有甲、乙两人,一起在玩暗盒中抓乒乓球的游戏(抓出后再放回),一个暗盒中共有6乒乓球,分别标上1~6的6个数字,甲、乙两人约定,若两人所抓乒乓球上的数字之和为5、6、7、8这4个数字中的一个时,即为甲胜出,否则则判定乙在本次游戏中胜出。在本次抓乒乓球的游戏中,甲和乙所抓乒乓球上数字组合的结果一共有36种(即6×6=36),而这36种结果中有21种结果时两人所抓乒乓球上数字之和为5、6、7、8,即甲在本次游戏中胜出的概率为7/12。
推荐阅读:《经济统计学》ChinaEconomicStatisticsQuarterly(季刊)2013年创刊,是统计学在经济领域中的应用学科,是以经济数据为研究对象,包括经济数据的采集、生成和传输,用统计方法分析经济数据背后的经济现象以及复杂经济系统的规律,从而为经济和管理决策服务。