大数据将是继云计算、物联网之后IT产业又一次颠覆性的技术变革 。电影《天下无贼》里有这样一句经典对白:“21世纪什么最贵?人才!”如今,选项可能还要加上一个:数据 。
而这数据,已不是传统意义的一般数据,而是超大数据、海量数据,就是现在所谓的“大数据(Big Data)” 。
如今大数据可谓是风起云涌,红红火火,俨然成为信息技术领域最时髦的词汇 。IBM、微软、Oracle、SAP等IT巨鳄,像是寻找到了新的金矿,开始全力挖掘大数据,多方位推广大数据理念,而众多中小IT厂商也跟着蜂拥而至,以分得大数据市场一杯羹 。

文章插图
数据爆炸的冲击波
“大”字不仅意味着数据的数量庞大,还代表着数据种类繁多、结构复杂,变化的速度也极快 。研究表明,大数据呈现三种特性:Volume(极多的数据量)、Velocity(极快的处理速度)、Variety(极繁的数据种类) 。如今有许多企业已面临单日数据量以数十、数百TB(万亿字节)的速度增加,而近几年累加的总数据量也达到了PB(1000个TB)甚至EB(一百万个TB)等级,这样的数据量已让传统的数据库难以处理;而且企业数据增加的速度也越来越快,诸如移动化、社交网络的广泛应用,使得数据增加的速度比传统的企业应用程式来得快很多,一旦数据增生速度越快,数据处理、分析的速度也就得跟上;此外,数据更是呈现出多样性、复杂性的特征,一方面互联网不但产生文字资讯,同时也不断在产出与以往不同的数据:照片、视频、微博等,另一方面,IT遍及工作生活中的每个角落,各种各样的传感器、监控器也不断产生,各种机器资讯数据的形式日趋复杂、多样了,从结构化数据到非结构化数据不断转化 。这就催生了大数据技术的强烈需求 。
今天,从搜索引擎、社交网络的普及到人手一机的智能移动设备,全球互联网上的信息总量正以每年30%-50% 的增速不断暴涨,包括每天Facebook上分享的几亿条内容,每日15 TB的Twitter信息,每天淘宝上数十亿条店铺、商品浏览记录及上亿的成交、收藏记录以及3000多万条传感器资讯,等等 。市场研究机构IDC的研究结果显示,去年全球创造的信息数量达到1800EB,并且还以每年50%的速度高速增长,到2020年,全球每年产生的数字信息将达到35ZB(1ZB=1024EB) 。据IDC统计,2011年全球所产生的数据总量是1.8ZB,如果把这些数据刻录到CD碟片中,这些碟片可环绕地球30圈 。
可以说,目前大部分企业经营决策面临的最大挑战不是缺少数据,而是数据太多,面对这些只是静态、孤立、无多大参考意义的“初级品”的信息数据,企业信息部门如何通过系统功能来有效利用和整合,发掘有价值的数据,给公司营销管理提供决策支持,已成为摆在企业信息部门及其他管理部门面前的难题 。
而浩如烟海的客户及市场、销售和服务信息,如果没有一个具有高度商业智能的数据分析和处理系统是不可想像的 。而用户想要从庞大海量的数据库中提取对自己有用的信息,就离不开大数据分析技术和工具 。事实证明,传统基于过往事实的商业管理系统如BI(智能分析系统)、CRM(客户管理系统)也能够为企业带来价值,但是今天一个优秀的大数据系统更能将数据挖掘技术与现有技术很好地结合起来,将特殊领域的商业逻辑与数据仓库技术集成起来,找出对未来企业战略具有影响的因素,使数据挖掘的分析效果和效益尽可能达到峰值,让企业营销管理能“运筹帷幄,决胜千里” 。
像Facebook、Twitter这样面临数据量大爆炸的国际社交网络公司,已开始用分布式程序系统基础架构、非关系型的数据库等新兴大数据技术来解决海量市场信息问题,并取得了成效 。国内最大电子商务公司阿里巴巴也在利用大数据技术提供具体服务,如阿里信用贷款与淘宝数据魔方 。以淘宝数据魔方为例,利用淘宝平台上的大数据应用方案,商家可以了解淘宝平台上的行业宏观情况、自己品牌的销售情况、市场排名、消费者行为情况等,并可以据此作出经营决策 。
- 大卫杜夫雪茄价格表图 davidoff香烟价格
- 美国军费首破8千亿美元威胁有多大
- 武大三行情书前十名
- 大扫除有哪些项目
- 虎宝宝名字大全2022
- 大米过期了还能吃吗
- 500g汤圆大概多少个
- D罩杯相当于多大的水果
- 五行茶的功效
- 铜环的好处和坏处 铜环好不好呢
特别声明:本站内容均来自网友提供或互联网,仅供参考,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系,我们将在24小时内删除。
