700字范文,内容丰富有趣,生活中的好帮手!
700字范文 > 大数据时代的“大”该如何理解?

大数据时代的“大”该如何理解?

时间:2019-11-04 10:42:15

相关推荐

大数据时代的“大”该如何理解?

这段时间,“大数据时代”又再度成为热门词汇。

大数据,是否就是海量的数据呢,可能大多人会都这样认为。

大数据,具有海量的数据,这是没错的。

人们在海量数据中寻找方向

我们曾经形容数据的量,常常用KB、MB、GB、TB 为单位,个人电脑存储基本可以满足这种需求。而大数据是什么级别呢?PB级别、EB级别,还是ZB呢。我们都知道,依次量级都是按1024的倍数来计算的,下面我们举例来说。

数据在不断增大 ,芯片在不断小型化

曾经有人做过推算:1TB,只需要一块硬盘可以存储,容量大约是20万张照片或20万首MP3音乐,或者是671部《红楼梦》小说。

1PB,需要大约2个机柜的存储设备。容量大约是2亿张照片或2亿首MP3音乐。如果一个人不停地听这些音乐,可以听1900年。

1EB,需要大约2000个机柜的存储设备。如果并排放这些机柜,可以连绵1.2公里那么长。如果摆放在机房里,需要21个标准篮球场那么大的机房,才能放得下。

阿里、百度、腾讯这样的互联网巨头,数据量据说已经接近EB级。

EB还不是最大的,目前全人类的数据量,是ZB级。全球电子设备存储的数据,将达到几十ZB。如果建一个机房来存储这些数据,那么,这个机房的面积将比42个鸟巢体育场还大。

而且,数据量还在以每年50%的速度增长。也就是说,每两年就会增长一倍。不过,随着芯片的发展,网速的提升和大数据技术的进步,我们的存储介质会越来越小,存储分布越来越广,数据移动会越来越快,今后,一些制约大数据的问题都会不再是问题。

但是,我们现在所说的大数据,只是数据量大吗?其实,它还具有以下特性。

来源的广泛性:

举例来说,数据来源包括但不限于:各类国家、机构、企事业单位、公司的数据库数据,开源的数据发布,GPS信息,网络痕迹(如购物、搜索历史等),各类物联网传感器收集的数据,用户自行保存、上传网络的数据等等。

人们手持的各种电子产品产生大量数据

数据的多样性:是说数据可能是结构性的数据,像我们的关系型数据库管理的数据,按关系二维表和一定的范式要求存储的,也可能是非结构行的文本,图片,视频,语音,日志,邮件形式存在。

数据实时性:在当今互联网,物联网快速发展的时代,很多数据要求实时处理,高效缓存,实时流式计算,数据订阅和即席分析和查询等等,这些都要求数据处理的实时性。现在的大数据系统,处理数据的实时性,已经变成了常规的要求。

数据的不确定性: 数据是存在真伪的,各种各样的数据,有的有用,有的没用。很难辨析。这种数据可能是原始数据受到采集和传送的限制,本来就不准确,也可得到的数据的粒度不符合要求,或者,出于隐私保护等特殊目的,某些应用无法获取原始的精确数据,而仅能够得到变换之后的不精确数据,还有数据原始采集不完整,数据集成出现差错等等。

总之,大数据时代数据的“大”,除了海量,还有数据来源广泛性,多样性,实时性,不确定性等特征。如果我们掌握好这些特性,处理好这些特性,应用好这些特性,大数据将会更加方便快捷地为数字经济服务。

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。