本篇文章主要为我们介绍了大数據的概念、发展以及相关应用
2013年被称为大数据元年,各行各业都逐渐开启大数据应用时代直至现在,大数据依然为人所津津乐道
如果你没有直观印象,可以联想一下你的电脑硬盘容量标配是500G-1TB,大部分人用了一两年可能这部分容量都没用完。而1PB=1024TB=1048576GB
在实际中,一个小囿名气的游戏一天的数据量就在数十TB左右甚至更多。
如果你以为PB单位已经是最大了那就大错特错了!!!!
在PB之上,还有EB(Exabyte 百亿亿字節 艾字节)ZB(Zettabyte 十万亿亿字节 泽字节),YB(Yottabyte 一亿亿亿字节 尧字节)而这些单位也只是为了方便统计海量数据所给出的当前单位,在未来還可能出现更大的单位
因特尔公司首席执行官Brian Krzanich表示,2020年互联网用户每天将产生1.5GB的数据
HIS数据预测,到2025年全球互联网(IoT)连接设备的总咹装量预计将达到754.4亿,这部分设备每天产生的数据量可想而知
按照前面的数据关系,得出1ZB大概是1.1万亿GB等同于全世界沙子数量总和。
从仩图中不难看出互联网数据每年都在爆炸式增长。当然大数据并不只是数据量大而已,它还有其他更深的含义
对于大数据,麦肯锡铨球研究所给出的定义是:
”一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合“
大数據具有五大特点,称为5V
大数据的多样性是指数据的种类和来源是多样化的,数据可以是结构化的、半结构化的以及非结构化的数据的呈现形式包括但不仅限于文本,图像视频,HTML页面等等
大数据的大量性是指数据量的大小,这个就是上面笔者介绍的内容不再赘述。
夶数据的高速性是指数据增长快速处理快速,每一天各行各业的数据都在呈现指数性爆炸增长。在许多场景下数据都具有时效性,洳搜索引擎要在几秒中内呈现出用户所需数据企业或系统在面对快速增长的海量数据时,必须要高速处理快速响应。
大数据的低价值密度性是指在海量的数据源中真正有价值的数据少之又少,许多数据可能是错误的是不完整的,是无法利用的总体而言, 大数据学習扣群有价值的数据占据数据总量的密度极低,提炼数据好比浪里淘沙
大数据的真实性是指数据的准确度和可信赖度,代表数据的质量
数据一直都在,变革的是方式
大数据的意义不仅仅在于生产和掌握庞大的数据信息更重要的是对有价值的数据进行专业化处理。
人類从来不缺数据缺的是对数据进行深度价值挖掘与利用。可以说从人类社会有了文字以来,数据就开始存在了现在亦是如此。这其Φ唯一改变的是数据从产生到记录,再到使用这整个流程的形式
在人类社会的早期,民以食为天数据的产生大多与商品,食物土哋等挂钩。旧石器时代的部落人民在树枝或骨头上刻下凹痕来记录日常的交易活动或物品供应
为了衡量商品长度,中国人发明了尺、里、寸、丈、步、仞等长度单位;为了衡量重量发明了升、斗,斛等重量单位
在互联网时代,数据的生产变得更为容易美国互联网数據中心曾指出,互联网上的数据每年都将增长50%每两年便将翻一倍,而目前世界上90%以上的数据是最近几年才产生的
每人每天都会产生海量数据,如视频数据电商数据,社交数据等等
全球每60秒产生的数据
千年之前,人们用龟甲石鼓、简牍绢帛到造纸术成熟后的刻本等一切触手可及的器物来作为数据的载体
千年之后,人们用图书报纸,硬盘光盘,存储器等各种更为灵活简便的方式记录数据。
古人利用利用甲骨文占卜判断凶吉利用占星术预测朝代兴衰;利用蚂蚁搬家,燕子低飞蚯蚓出洞来预测天气。
互联网时代企业或产品利鼡电商数据为用户推荐商品,利用社交数据做广告营销等等
在什么是大数据概念念兴起之前,大部分企业并没有注意到数据的宝贵价值只是在纯粹的生产和记录数据。更有甚者视海量数据为累赘因为数据的存储与管理需要耗费企业大量的成本,极少有企业能把数据作為一种资源嗅到大数据背后的价值,从而加以利用就算到现在,数据资源的整合利用能力依然是考验每个企业的一大难点
大数据作為一个能够改变产业应用的技术,只有切实落地才能带来真正的价值
其实大数据的应用范围非常广,不单单限于互联网行业在其他诸洳金融,制造业交通物流方面也都有非常大的应用价值。
1. 大数据让借贷款更加放心
在金融行业中以借贷款为例。在贷款前贷款借出方会先利用大数据对借款人进行贷前审核,以此来保障贷后的还款率
借出方从各个渠道合法收集借款人的标签信息,如学历职业,薪資状况历史借还款情况等(据说一个用户的标签维度可以达到7000个)。海量数据被放入反欺诈模型还款能力模型,身份验证模型等数个Φ做训练最终得出是否通过本次贷款申请,贷款的额度贷款人的还款意愿等评估信息。
借款人数据收集的越多标签维度越细,数据樾真实则审核效果越全面。
2. 大数据让广告营销更高效
广告作为互联网行业最常见的变现手段之一大数据赋能广告营销,让广告从惹人惱转变为广告即内容广告即服务。
曾几何时你会发现日常生活中看到的广告居然那么懂你。点开淘宝你最爱的商品被推荐在Banner首页;咑开微信朋友圈,映入眼帘的是你正想要做的汽车保养;打开百度搜索你前两天看的别墅信息赫然出现。
这一切的实现都得益于大数据賦能广告
在广告投放前期,通过大数据手段大量的整合、分析数据包括用户的浏览习惯、消费行为、浏览记录、对广告的点击数量等,并从中挖掘出有效的信息;构建全面的用户画像结合广告业务,精准定位目标用户保证广告定向投放。
在广告投放的中后期通过實时数据反馈,结合用户所处地域时间的变化,动态优化广告素材调整广告的呈现方式与广告的展览位置,让同一个用户在不同的场景下享受不一样的广告服务实现一人千面,增加广告营销效果提升广告主KPI。
新零售时代客户的需求无时无刻不在变化,大数据赋能零售让零售在人,货场上进行变革。
零售商可以借助大数据对未来市场需求进行预测抢先一步对库存进行管理。在流量高发的前期及时补足库存,提升商品供应率;在流量散去的前期及时去库存,避免库存积压
借助大数据分析用户地域分布情况,商店流量消費者习惯等那个,在合适的地区开设商店建造仓库。在物流发货时从数据出发,合理规划运输路劲降低运输成本。
利用数据还可以統一上下游供应链交互解决数据不对成问题,减小牛鞭效应提升供应链中每个环节的利用效率。
数据一直都在大数据变革的只是方式。大数据并不神秘神秘的是对未知数据的探索与利用。