当前位置:市保密局信息摘要

大数据是不是万能钥匙

来源:中国保密在线(http://www.baomi.org/)  时间:2016年11月15日 【打印窗口】 【关闭窗口】

大数据是不是万能钥匙

2016年07月19日新闻来源:

作者罗 成

随着互联网的发展,大数据这块儿蕴含巨大财富的宝藏,给世界带来了无限的期待和遐想。脸书对个人喜好的预测、阿里巴巴对消费能力的评估、警察局对案发地的预测等,似乎一切都在大数据的“掌握”之中。

然而,从另一个角度冷静思考,大数据所带来的危险正愈演愈烈,“棱镜门”、12306信息泄露等事件让人不寒而栗。因此,充分认识大数据背后的隐患,树立正确的大数据思维,是进一步发挥大数据优势,为人类社会创造更大价值的关键所在。

揭开“伪大数据”的面纱

我们生活在一个任何人都无法摆脱数据的大数据时代,数据每天都在呈爆炸式增长。产生的数据越多,人们作出的分析也就越多。买房需要数据,买车需要数据,甚至每天交通工具的选择也离不开数据,数据的产生与分析随时影响着我们的每一个决定。

然而,数据远远没有我们想象的那么可靠,数据自身的质量差异、数据收集的合理与否、数据分析的对错与否等,这些都可能对最终结果产生重要影响。全球著名的盖茨基金会曾通过一系列数据分析后得出这样的结论:“学校规模是影响教学质量的重要因素——每个年级最多不能超过100名学生。”于是,比尔•盖茨在全美范围内选了一些大型学校,并投入上亿美元把这些学校拆分成更小、更高效的小型学校,从而优化课程设置、改进教学质量。然而10年后,盖茨基金会在对学校重组前后效果进行调查研究后发现,重组后学校的平均成绩没有变得更好,相反,在某些个例中变得更差了。出现这种结果就是因为前期的数据分析出现了问题。

在大数据时代,不仅有很多精确的分析,也有不少错误的分析。在海量数据面前,无论是权威专家还是经验丰富的行家,都有可能被迷惑,误入大数据背后的迷雾而无法前行。

为了揭开“伪大数据”的面纱,减少分析错误,我们可以从以下3方面抓起:一是做好数据收集。通过分析事物间的相关关系,去粗取精,确定需要收集的数据种类,做好数据的区分与归类;通过数据筛选与过滤,去伪存真,防止伪数据的流入,保证数据的质量;加强数据收集的能力,提高数据库的容量,确保数据样本具有全体性。二是搞好数据存储。严格规范数据存储的主体,做好“后棱镜门”时代的数据管理工作;制定严密的规章制度,明确数据存储与流转的程序,防止数据意外流出;严格落实责任追究制度,责任到岗、落实到人,确保数据存储的安全性。三是抓好数据分析。严格规范数据分析的主体,对一些别有用心的企业、机构等坚决予以打击;根据实际情况,选择最为恰当的数据分析方法,避免资源浪费或走弯路;规范数据分析的程序,确保每一步都有章可循、有理可依,在保证合法性的前提下提高结果的精确性。

杜绝数据独裁主义的思潮

随着越来越多的事物被数据化,决策者们对数据的痴迷程度愈发强烈,似乎他们在作每一个决定前的第一件事就是得到更多数据来进行量化分析。

然而数据远远没有我们想象的那么强大,过度依赖数据则可能导致适得其反的结果。2009年,谷歌首席设计师道格•鲍曼因被公司要求利用数据证明“边框像素的倍数选择的正确性”而愤然离职,并在博客上发文称:“数据成为了一切决策的主宰,束缚住了整个公司。”在此之前,曾任美国国防部部长的麦克纳马拉也是一个完全依赖数字的人。在越南战争期间,他每天都在报纸上公布越方死亡人数,并以此来评判战争进度。战后,退休将军道格拉斯•金纳德出版了《战争管理者》(The War Managers),书中揭露了量化的困境,指出仅有2%的美国将军认为用死亡人数衡量战争成果是有意义的,2/3的人认为大部分情况下数据被夸大了。甚至有将军认为就是像麦克纳马拉这样的人表现出了对数据的极大热忱,才导致很多部门一层一层地将数字扩大化了。

20世纪的美国痴迷于数据,21世纪的谷歌同样也无比依赖数据,可见,数据独裁就在我们身边。在迈向大数据时代的关键时刻,谷歌对数据的依赖,美军在越战中对数据的滥用、误用,无疑都在提醒我们:客观、理性、冷静地对待大数据“热”,不痴迷于数据,才能更好地让数据为我们所用。

那么,如何才能杜绝数据独裁主义的出现、充分认识大数据的真正价值呢?其一,要树立正确的思维理念。大数据并非无所不能,它也有自身的局限性,不能盲目信任大数据的力量和潜能;树立科学利用大数据的思维,面对“大数据热”,要冷静对待、理性分析,结合自身实际制定发展规划,切不可盲目跟风;转变传统的思维模式,由收集随机抽样样本转为收集具有全体性的数据样本,由追求数据的精确性转为接受数据的混杂性,由探求事物的因果关系转为关注事物的相关关系。其二,要培养过硬的人才队伍。创新用人机制,解决大数据人才匮乏的难题,完善人才政策,制定科学合理的人才发展规划,强化技能培训和交流学习,加强同地方高等院校、科研院所和企业的合作,开展多样化人员培训活动,提高大数据人才整体技术水平。其三,要构建科学的结构体系。建立数据收集协调机构,收集整合数据资源,打破数据之间的部门、企业和地域限制,实现数据的统一管理和互联互通;建立数据分析评估机构,立足单位实际和发展需要,结合阿里巴巴、谷歌等平台的成功经验,全面开展数据分析评估;建立数据决策指挥机构,降低情感、经验等主观因素对决策指挥的影响,实现智能决策,提高决策指挥的精确性。

减少对个人隐私权的侵害

2012年3月,奥巴马政府发布了“大数据研究和发展规划”;2012年5月,英国政府宣布建立世界首个开放数据研究所;2013年,日本宣布2013—2020年实行以发展开放公共数据和大数据为核心的新IT国家战略。在大数据发展成为国家战略的背景下,数据逐渐成为国家的重要资源,需求日趋旺盛,但与之相伴而来的却是日渐猖獗的数据滥用、黑市交易等。

淘宝监视着我们的购物习惯,百度监视着我们的网页浏览习惯,微博时刻在偷窥我们的喜好,我们生活在一个时刻暴露在“第三只眼”的时代,随时都面临着隐私暴露的危险。仅2011年至2015年6月的这段时间里,全球约有总计11.2167亿用户隐私数据遭泄露:2011年12月,天涯网4000万用户隐私遭黑客泄露;2012年11月,包括EMS在内的10余家主流快递企业的单号信息被大面积泄露,并衍生出多个专门从事快递单号信息交易的网站;2013年11月,7000万个腾讯QQ群数据泄露;2014年1月,韩国1亿多条信用卡个人信息泄露;2015年3月,美国医疗保险服务商Anthem公司信息系统被黑客攻击,近8000万员工和客户资料泄露……

大数据在给人类社会带来便利的同时,也给个人隐私权的保护带来了极大的挑战。毫无疑问,如何有效保护个人隐私,已经成为世界各国亟待解决的难题。

防止数据泄露事件的发生、减少大数据对个人隐私权的侵害,已成为信息时代环境下,政府和有关机构甚至公民个人都亟须解决的一个迫切问题。首先,要在全社会范围内强化个人数据保护观念。通过公共媒体普及涉及隐私的法律常识,提高公民守法、护法、用法意识;利用各类案例强调个人数据的重要性及泄露后可能带来的问题,提醒公民不要轻易向第三方提供涉及隐私的信息;利用安全防护软件定期清查电脑、手机等终端,及时清理可能暴露隐私的数字信息。其次,要健全相关法律法规。在分析个人数据权利属性的基础上,明确个人数据权的法律地位,规范公共权力机构收集、处理、交易、应用数据的行为,确保其始终处于法律法规的监督之下,同时要明确对个人隐私侵害的救济权。最后,要完善安全监管体系。由政府主导成立专门的监管机构,由行业自建成立第三方保护组织,做好二者协调配合;完善登记、审查、收集、处理、交易、应用、监督举报、责任追究等监管机制,保证顺畅运行;加强技术创新,推动保护隐私产品研发,有效保护个人隐私。

大数据时代才刚刚拉开帷幕,在这个“人人都在为大数据翘首点赞”的世界里,我们不仅要让数据为我们所用,真正发挥大数据的优势,更要擦亮双眼,冷静应对,正确认识大数据背后的隐忧。■

(作者单位:西安政治学院)