基于层级分析法的大数据时代下统计工作变革
程茜 王艳 杨卫 西安欧亚学院 基金项目:陕西省统计科学研究:利用大数据提高统计工作质量与效率的创新方法研究 (A类-2016LD03) 摘要:大数据时代下传统统计工作的方方面面受到了挑战,不仅数据的采集方式发生了很大改变,同时数据量级也得到了扩充。那么传统的统计方式就变得不再适应新环境下的统计工作。本文基于大数据时代下影响统计工作效率和质量的问题建立层次分析模型,通过对各因素的分析,分析大数据时代带来的统计工作的变革,以此建立新的统计体系来提高统计效率和质量。 关键词:大数据 层次分析法 传统统计 一、 引言 随着“云计算”,“物联网”,“大数据”等概念的到来,给我们带来了海量数据。 伴随而来的是统计工作发生了翻天覆地的改变。大英百科全书认为“统计学是一门搜集数据,分析数据,并根据数据进行推断的艺术和科学,最初与政府搜集数据有关,现在包括了范围广泛的方法和理论”,这一广泛的范围在大数据时代下变得更为广阔,从各个行业,政府、金融、医疗、教育…….,到电话、微信、QQ、微博等各式各样的社交网络,都成为了统计涉足的领域。能够成为数据的东西越来越多,存储能力也越来越强大,很多常用的统计方式无法处理,这就需要统计方式发生改变,否则,统计质量将会降低。 传统的统计方式在数据收集方面主要表现在两个方面:1、数据收集方面需要专门的统计采集,如进出口、财政、货币供给等数据在各项相应的行政记录里,现在均可以通过网络连接起来,各种交易可以直接生成数据。2、数据分析利用方面,主要针对结构化的数据进行分析处理,但是对于可能成为数据的图片、声音、视频等非结构化数据还需要进行分析,可以进行公共服务。 二、 指标设计 层次分析法(AHP)是美国匹兹堡大学教授T.L.Satty于20世纪70年代初提出的一种定量与定性相结合的系统分析法。把与决策相关的元素进行分解,并划分为相互联系的有序层次,分为目标层、准则层、指标层,并在此分解基础之上进行定性以及定量分析的决策方法。AHP被广泛应用于社会经济系统等领域的决策之中,并结合相关数据、专家和分析者的客观判断共同来分析。 图1层次结构 (一)构造层次结构 通过查阅相关文献,将大数据时代下影响统计效率的因素主要分为四个:工作方式、工作职能、方法制度、数据质量。四个因素相互影响。建立包含三个层次的AHP模型,目标层是统计效率;指标层包含四个因素;方案层就传统统计与大数据时代下的统计工作效率进行对比。 层次分析法的一个重要特点就是用两两重要性程度之比的形式表示出两个方案的相应重要性程度等级。如对某一准则,对其下的各方案进行两两对比,并按其重要性程度评定等级。记为第 和第 因素的重要性之比,表3列出Saaty给出的9个重要性等级及其赋值。按两两比较结果构成的矩阵 称作判断矩阵。判断矩阵 具有如下性质: 表1 层次分析法的尺度表
1、工作方式 大数据时代下,记录数据的方式发生改变。传统统计环境下,搜集数据的方式主要靠行政记录、报表收集、用户谈话、调查问卷等。数据采集汇聚的时间相对较长。大数据时代下,有了互联网的助力,使得数据收集的量级和复杂程度远远高于以往,甚至以往不能作为数据的均可以以数据的形式出现,如声音、图片、视频等。 2、工作职能 随着计划经济向市场经济的转化,市场的价格信号会告诉市场主体需求和供给的变化,而不再需要统计部门提供社会的需求量,供给量来实现社会总需求与总供给的平衡。那么原有的统计的工作职能会慢慢弱化物量统计。整个统计工作的的职能、理念都会发生改变。大数据时代下的统计,更多的是发挥其咨询、监督的职能。在海量数据中分析内在错综复杂的层次关系。 3、方法制度 大数据时代的来临及其应用将意味着统计工作进入到了一个新的阶段,数据生产部门不再是唯一的数据制造部门,必须接受数据生产社会化的现实。目前的统计体系和方法制度将不能适应新时代的要求。大数据时代下,统计机构分布在商务、劳工、卫生等政府部 门,通过分散的统计,实现信息数据的共享和汇总,从而全面、精准地完成统计工作。大数据也为我国传统统计工作提供了数据共享的机遇, 将在政府部门信息平台融合、传统统计部门与调查者之间建立合作互惠的新型关系,并发挥重要的作用。 4、数据质量 传统的统计工作不能保证统计数据是否适应用户的需求,动态数据需要及时进行调整, 否则会产生很大的误差,基于大数据的数据收集可以做到全样本分析,对总体进行分析,使得误差大幅度下降。 (二)构造两两比较矩阵 在不同层次上,通过专家、统计工作者和大数据研究人员的评分,对该层次指标进行成对比较,形成判断矩阵: 表2 目标判断矩阵
注;CR=0.0001(如果CR<0.1,则此判断矩阵满足一致性检验要求) 表3 工作方式因素判断矩阵
注;CR=0.0034 表4 工作职能因素判断矩阵
注;CR=0.0002 表5 方法制度因素判断矩阵
注;CR=0.0012 表6 数据质量因素判断矩阵
注;CR=0.0027 三、 评价指标体系结果分析 根据各因素对其上一层次的权重值,归一化后可以得到最后的选择方案。无论是工作 方式、工作职能还是方法制度和数据质量,大数据下的统计效率明显都得到了提高。大数据对统计效率的影响,提高了统计的数据质量,降低了统计成本,对大数据的搜索、分类和聚类等还需要统计方法,建立新的统计体系,强化结构和非结构化数据的对接,建立新的数据梳理和分类方法。 参考文献: [1]刘新海.大数据挖掘助力未来金融服务业[J].金融市场研究,2014,(2). [2]方方.大数据时代的到来[J].新科幻,2013(4). [3]邬贺铨.大数据时代的机遇与挑战[J].求实杂志,2013(4). [4]刘敏.高校统计:在挑战与机遇中改革创新[J].绍兴文理学院学报, 2002, (2). [5]计算机行业-大数据( Big Data) 专题报告[R].上海:光大证券股份有限公司研究所,2011. [6]毕建新,陈雅,郑建明. 面向科学大数据的云计算平台构建研究[J].现代教育技术,2013,(10). [7]宗威.大数据时代下数据质量的挑战[J].西安交通大学学报,2013,33(5):38-43. |