2.1.2 大数据的特点

大数据具有大容量、复杂性、速度性和价值性的特点。大容量即大数据所包含的数据量是以往所不能比拟的。受传统的数据收集能力和存储能力的限制,数据只能被保留下来较少的一部分,而且时间一长就会被新数据所替代,不能保留较长的时间,而大数据不仅能够包含数量庞大的数据,并且数据能够持久保存。复杂性即大数据的种类和来源多样且复杂。每个行业都有自身独特的性质,所产生的数据类型也就不一样,因此数据具有高度的复杂性,人们还需要对数据进行处理,提取对自己有用的数据,简化其复杂性,这样才能发挥大数据对社会生产生活的重要作用。速度性即大数据获取数据的速度很快。相对于传统的数据获取速度而言,大数据获取数据的能力非常强大,它能够以很快的速度对大量数据进行收集并且完成储存。价值性即大数据具有很强的价值功能。它的价值主要在于能够有效地挖掘出单个数据之间所蕴藏的某种关联性,并且能够通过清晰明了的方式将模糊复杂的问题以可视化的方式进行有效地解决,并为接下来的工作提供参考性较强的建议和安排,从而发挥出它的巨大潜在价值。大数据必须经过有效的处理才能广泛地应用于教育、医疗、通信等各个行业上,因此出现了一门专门处理大数据的技术称为大数据技术。该技术通过对收集和存储完毕的大量数据运用云计算等先进技术进行分析处理,最后得到一些对人们有价值的信息资源,然后转换商业价值变为数据资产。传统的技术在对庞大的数据进行处理时,一般仅仅对数据生成报表,然后人们对报表所展现出来的数据趋势进行人为描述,这对于数据的利用是非常低效的,并且还不能挖掘出各数据间的特殊关联。因此要想实现对数据的高效利用,挖掘其中的潜在价值,然后应用于各行业,还需要能够实现数据的自我分析,自我诊断。

随着科技的不断进步想要了解的某种事物的关联性,就能够高效快速地对数据完成自动处理。要想更好地利用大数据,我们就需要对它如何收集数据、存储数据、加工数据和提供数据的服务过程进行了解。对于数据的收集,可以根据其时效性分为实时收集和批量收集。所谓实时收集就是在数据产生时立刻进行收集,它会在数据产生的第一时间内完成收集工作,而不管数据规模的大小,各行业的交易数据通常会通过实时收集。而批量收集就限制了数据的规模大小,在数量满足条件时才会被数据库收录,通常数据都会在积攒一定程度后,在达到要求时才会被批量收集起来;对于数据的存储来说,既需要支持数据的实时请求,又需要满足大批量的运算要求。实时数据一般具有较高的并发实时响应、较小的数据粒度等特点,因此需要采取列式储存、搜索引擎储存等形式,以及时满足下游系统实时储存的要求。而批量数据和以往的历史储存数据量较大,一般经储存后就不再被修改,因此可以采取分布式的文件系统储存形式进行存储,并且可以对数据进行适当压缩,这样既提高了运算速度,节省了储存空间,又能降低储存的成本;在数据加工方面,对于实时数据的处理,先根据其数据处理的业务要求,然后运用SPARK计算框架进行实时处理,对于批量数据和以往的历史数据进行处理时,则采用混合计算框架进行处理。对离线数据与实时数据进行分别处理,既满足了业务的实时性,又满足了数据的准确性。通过强大的大数据处理能力,不但能减轻系统压力,还能对数据进行标准化管理。不断更新收集到的数据,也为大数据的广泛应用奠定了量的基础,但同时也加大了对数据处理能力的要求,因此我们要不断改进处理数据的技术,以便让数据发挥出最大效用;数据的服务能力则是使大数据发挥出最大效力的功能,根据数据运用的层次可分为基本的数据检索服务、挖掘数据及检索服务、模型运算服务。它们提供了不同层次的服务,满足了使用者多样的业务需求。大数据的自身优势对于开展普惠金融业务来说,体现在能通过对金融业积累的大量数据运用云计算等方式进行分析处理,得出一些有效的信息资源,从而对金融机构的服务和产品进行不断创新,提高金融机构运营的效率,提升对风险的控制,精准地针对客户开展营销业务,增加各金融机构的业务办理量和经营利润,以更好地促进普惠金融业务的开展。

图2-2 普惠金融开展的各项便民支付业务

数据来源:知乎,https://zhuanlan.zhihu.com/p/22351565。