什么是大数据?大数据能做什么?
第一集该文主要为我们如是说了大统计数据的基本概念、发展和有关应用领域。

“Big Data is like teenage sex:Everyone talks about it,nobody really knows how to do it,everyone thinks everyone else is doing it,so everyone claims they are doing it too.”
2013年被称作大统计数据元年,各个领域都逐渐开启大统计数据应用领域黄金时代。直至现在,大统计数据依然为人所称道。
何谓大统计数据?
1PB够大吗?
如果你没有直观印象,能联想一下你的电脑硬盘空间,标准配置是500G-1TB,大部分他用了两三年,可能将该些容量都没用完。而1PB=1024TB=1048576GB。
在实际中,一个颇受欢迎的游戏六天的统计信息量就在数十TB左右,甚至更多。
如果你以为PB基层单位已经是最大了?那就暗笑了!!!!
在PB之上,还有EB(Exabyte 百ZR19二进制 艾二进制),ZB(Zettabyte 十万ZR19二进制 泽二进制),YB(Yottabyte 一ZR19亿二进制 尧二进制),而这些基层单位也只是为的是方便统计海量数据统计数据所得出的当前基层单位,在未来还可能将出现更大的基层单位。

TNUMBERG34iss公司首席执行官Brian Krzanich表示,2020年网络使用者每晚将造成1.5GB的统计数据。
HIS统计数据预测,到2025年,亚洲地区网络(IoT)连接电子设备的总安装量预计将达到754.4亿,该些电子设备每晚造成的统计信息量可想而知。

按照前面的统计数据关系,得出1ZB大概是1.1万亿GB,等同全世界沙子数量总和。
从上图中由此可见,网络统计数据每月都在爆发式快速增长。当然,大统计数据并不只是统计信息量大而已,它还有其他更深的含义。
对于大统计数据,毕马威亚洲地区研究所得出的定义是:
”一种规模大到在获取、存储、管理、分析方面大大超出了传统统计资料库开发工具能力范围的统计数据集合。“
大统计数据具有五大特点,称作5V。
1. 多样(Variety)
大统计数据的多元性是指统计数据的种类和来源是多样化的,统计数据能是方式化的、半方式化的和非方式化的,统计数据的呈现出方式包括但不仅限于文档,图像,视频,HTML网页等等。
2. 大批(Volume)
大统计数据的大批性是指统计信息量的大小,这个就是上面笔者如是说的内容,不再约勒。
3. 高速路(Velocity)
大统计数据的高速路性是指统计数据快速增长加速,处置加速,每六天,各个领域的统计数据都在呈现出指数性爆炸快速增长。在很多场景下,统计数据都具有及时性,如浏览器要在几秒钟LX1呈现出出使用者所需统计数据。企业或系统在面对加速快速增长的海量数据统计数据时,必须要高速路处置,加速响应。
4. 低商业价值表面积(Value)
大统计数据的低商业价值表面积性是指在海量数据的统计管理工具中,真正有用的统计数据寥寥无几,很多统计数据可能将是错误的,是不完整的,是无法借助的。总体而言,有用的统计数据占据统计数据总量的表面积较低,提炼统计数据好比浪里洛佐瓦。
5. 准确性(Veracity)
大统计数据的准确性是指统计数据的精确度和安全可靠度,代表统计数据的质量。
统计数据一直都在,变革的是方式
大统计数据的意义不仅仅在于制造和掌握庞大的统计数据信息,更重要的是对有用的统计数据进行专业化处置。
人类文明从来不缺统计数据,缺的是对统计数据进行深度商业价值挖掘与借助。能说,从人类文明社会风气有了文字以来,统计数据就开始存在了,现在亦是如此。这其中唯一改变的是统计数据从造成,到历史记录,再到使用这整个流程的方式。
1. 统计数据制造
在人类文明社会风气的早期,从古到今,统计数据的造成大多与货品,食物,土地等挂钩。旧石器黄金时代的部落人民在树枝或骨头上铭刻穿孔来历史记录日常的交易活动或物品供应。
为的是来衡量货品长度,中国人发明者了尺、里、寸、丈、步、仞等长度基层单位;为的是来衡量总重量,发明者了升、斗,斛等总重量基层单位。
在网络黄金时代,统计数据的制造变得更为容易。美国网络统计网络系统曾指出,网络上的统计数据每月都将快速增长50%,每两年便将翻一倍,而目前世界上90%以上的统计数据是最近几年才造成的。
每人每晚都会造成海量数据统计数据,如视频统计数据,电商统计数据,社交统计数据等等。

亚洲地区每60秒造成的统计数据
2. 统计数据历史记录
千年之前,人们用龟甲石鼓、简牍绢帛到造纸术成熟后的刻本等一切触手可及的器物来作为统计数据的载体。
千年之后,人们用图书,报纸,硬盘,光盘,存储器等各种更为灵活,简便的方式历史记录统计数据。
3. 统计数据借助
古人借助借助甲骨文占卜判断凶吉,借助占星术预测朝代兴衰;借助蚂蚁搬家,燕子低飞,蚯蚓出洞来预测天气。
网络黄金时代,企业或产品借助电商统计数据为使用者推荐货品,借助社交统计数据做广告营销等等。
在大统计数据基本概念兴起之前,大部分企业并没有注意到统计数据的宝贵商业价值,只是在纯粹的制造和历史记录统计数据。更有甚者视海量数据统计数据为累赘,因为统计数据的存储与管理需要耗费企业大批的成本,极少有企业能把统计数据作为一种资源,嗅到大统计数据背后的商业价值,从而加以借助。就算到现在,统计数据资源的整合借助能力依然是考验每个企业的一大难点。
大统计数据应用领域
大统计数据作为一个能够改变产业应用领域的技术,只有切实落地才能带来真正的商业价值。
其实大统计数据的应用领域范围非常广,不单单限于网络行业,在其他诸如金融,制造业,交通物流方面也都有非常大的应用领域商业价值。

1. 大统计数据让借贷款更加放心
在金融行业中,以借贷款为例。在贷款前,贷款借出方会先借助大统计数据对借款人进行贷前审核,以此来保障贷后的还款率。
借出方从各个渠道合法收集借款人的标签信息,如学历,职业,薪资状况,历史借还款情况等(据说一个使用者的标签维度能达到7000个)。海量数据统计数据被放入反欺诈模型,还款能力模型,身份验证模型等数个中做训练,最终得出是否通过本次贷款申请,贷款的额度,贷款人的还款意愿等评估信息。
借款人统计数据收集的越多,标签维度越细,统计数据越真实,则审核效果越全面。

2. 大统计数据让广告营销更高效
广告作为网络行业最常见的变现手段之一,大统计数据赋能广告营销,让广告从惹人恼转变为广告即内容,广告即服务。
曾几何时,你会发现日常生活中看到的广告居然那么懂你。点开淘宝,你最爱的货品被推荐在Banner首页;打开微信朋友圈,映入眼帘的是你正想要做的汽车保养;打开百度搜索,你前两天看的别墅信息赫然出现。
这一切的实现都得益于大统计数据赋能广告。
在广告投放前期,通过大统计数据手段大批的整合、分析统计数据,包括使用者的浏览习惯、消费行为、浏览历史记录、对广告的点击数量等,并从中挖掘出有效的信息;构建全面的使用者画像,结合广告业务,精准定位目标使用者,保证广告定向投放。

大统计数据构建使用者画像
在广告投放的中后期,通过实时统计数据反馈,结合使用者所处地域,时间的变化,动态优化广告素材,调整广告的呈现出方式与广告的展览位置,让同一个使用者在不同的场景下享受不一样的广告服务,实现一人千面,增加广告营销效果,提升广告主KPI。
3. 大统计数据赋能零售
新零售黄金时代,客户的需求无时无刻不在变化,大统计数据赋能零售,让零售在人,货,场上进行变革。
零售商能借助大统计数据对未来市场需求进行预测,抢先一步对库存进行管理。在流量高发的前期,及时补足库存,提升货品供应率;在流量散去的前期,及时去库存,避免库存积压。
借助大统计数据分析使用者地域分布情况,商店流量,消费者习惯等那个,在合适的地区开设商店,建造仓库。在物流发货时,从统计数据出发,合理规划运输路劲,降低运输成本。
借助统计数据还能统一上下游供应链交互,解决统计数据不对成问题,减小牛鞭效应,提升供应链中每个环节的借助效率。
总结
统计数据一直都在,大统计数据变革的只是方式。大统计数据并不神秘,神秘的是对未知统计数据的探索与借助。
本文由 @pm_SWolf 原创发布于人人都是产品经理。未经许可,禁止转载
题图来自Unsplash,基于CC0协议
创业项目群,学习操作 18个小项目,添加 微信:88888 备注:小项目!
如若转载,请注明出处:https://www.152668.com/952.html