大数据及其可视化
上QQ阅读APP看书,第一时间看更新

1.1.2 天文学——信息爆炸的起源

综合观察社会各个方面的变化趋势,我们能真正意识到信息爆炸或者说大数据的时代已经到来。以天文学为例,2000年斯隆数字巡天项目(见图1-2)启动时,位于新墨西哥州的望远镜在短短几周内搜集到的数据,就比世界天文学历史上总共搜集的数据还要多。截至2010年,信息档案已经高达1.4×242B。不过,预计2016年底,在智利投入使用的大型视场全景巡天望远镜在5天之内即可获得同样多的信息。

天文学领域发生的变化在社会各个领域都在发生。2003年,人类第一次破译人体基因密码时,辛苦工作了十年才完成了三十亿对碱基对的排序。大约十年之后,世界范围内的基因仪每15min就可以完成同样的工作。在金融领域,美国股市每天的成交量高达70亿股,而其中2/3的交易都是由建立在数学模型和算法之上的计算机程序自动完成的,这些程序运用海量数据来预测利益和降低风险。

图1-2 美国斯隆数字巡天望远镜

互联网公司更是要被数据淹没。谷歌公司每天要处理超过24拍字节(PB,250B)的数据,这意味着其每天的数据处理量是美国国家图书馆所有纸质出版物所含数据量的上千倍。

从科学研究到医疗保险,从银行业到互联网,各个不同的领域都在讲述着一个类似的故事,那就是爆发式增长的数据量。这种增长超过了人们创造机器的速度,甚至超过了人们的想象。人类存储信息量的增长速度比世界经济的增长速度快4倍,而计算机数据处理能力的增长速度则比世界经济的增长速度快9倍,每个人都受到了这种极速发展的冲击。

以纳米技术为例。纳米技术专注于把东西变小而不是变大。其原理就是当事物到达分子级别时,它的物理性质就会发生改变。一旦知道这些新的性质,就可以用同样的原料做以前无法做的事情。铜本来是用来导电的物质,但它一旦到达纳米级别就不能在磁场中导电了。银离子具有抗菌性,但当它以分子形式存在时,这种性质就会消失。一旦到达纳米级别,金属可以变得柔软,陶土可以具有弹性。同样,当人们增加所利用的数据量时,也就可以做很多在小数据量的基础上无法完成的事情。

大数据的科学价值和社会价值正是体现在这里。一方面,对大数据的掌握程度可以转化为经济价值的来源。另一方面,大数据已经撼动了世界的方方面面,从商业科技到医疗、政府、教育、经济、人文以及社会的其他各个领域。尽管人们还处在大数据时代的初期,但人们的日常生活已经离不开它。