什么是大数据及用途?
发布时间:2018-10-29 作者:jason
大数据是大量数据。普通外行人的术语中的大数据可以被描述为大量的非结构化数据。它是一个术语,用于描述数量巨大且随时间不断增长的数据。大数据由结构化,非结构化和半结构化数据组成。该数据可用于跟踪和挖掘信息以供分析或研究之用。
什么是大数据?
简单来说,大数据是大量结构化,非结构化,半结构化数据,可用于分析目的。
Doug Laney给大数据一个新的定义,将其描述为三个V:音量,速度和多样性。
卷:大数据本身的名称表明它包含大量数据。在确定数据是否是“大数据”时,数据的大小非常重要。因此,“体积”是处理大数据时的一个重要特征。
速度:速度是生成数据的速度。在大数据中,速度是确定数据效率的一种度量。生成和处理数据的速度越快,将决定数据的真实潜力。数据流量巨大,Velocity是大数据的特征之一。
多样性:数据有各种形式,结构化,非结构化,数字等。早期的电子表格和数据库被视为数据。但现在考虑使用pdf,电子邮件,音频等进行分析。
让我们更多地了解大数据
对于想要维护文件和大量数据的企业而言,大数据对于企业来说非常重要。公司已转向大数据技术,以便维护数据以用于分析或业务开发目的。
大数据的重要性:
大数据不仅在数量方面很重要,而且在于您对数据的处理方式以及如何利用数据进行分析以使您的业务和组织受益。
大数据有助于分析:
时间
成本
产品开发
决策等
与Google Analytics合作时的大数据可帮助您确定企业失败的根本原因,并根据客户购买历史记录分析销售趋势。还有助于确定欺诈行为并降低可能影响组织的风险。
大数据类别
结构化的
非结构化
半结构化
结构化数据:以固定格式存储的数据称为结构化数据。在结构化数据中,数据被格式化以便于访问并可用于分析。
非结构化数据:任何结构未分类的数据称为非结构化数据。非结构化数据的大小非常庞大。非结构化数据通常由包含文本,图像,文件等组合的数据组成。它们不使用传统的数据库模型。
半结构化数据:它包含结构化数据和非结构化数据。数据不是在存储库中组织的,而是具有使其可访问的相关信息。
大数据的使用
大数据技术对企业非常有利,以提高效率和开发新的数据驱动服务。大数据有很多用途。例如,在分析包含天气报告的一组数据时,预测下一周的天气。
以下是大数据的一些用途以及使用它的地方
卫生保健
检测欺诈行为
社交媒体分析
天气
公共部门。
大数据在医疗保健中的贡献
大数据在医疗保健领域的贡献大大增加。随着医学的进步,需要存储大量患者的数据。大数据被广泛用于存储患者的健康史。
该数据可用于分析患者的健康状况并防止将来出现健康问题。
检测欺诈
欺诈检测和预防是当今BIg数据的众多用途之一。信用卡公司面临很多欺诈行为,大数据技术被用来检测和预防它们。
早期的信用卡公司会对所有交易进行跟踪,如果发现任何可疑交易,他们会致电买方并确认是否进行了交易。但现在观察购买模式,并使用大数据分析分析欺诈影响区域。这在预防和检测欺诈方面非常有用。
社交媒体分析
大数据的最佳用例是在Facebook,Twitter等社交媒体网络上不断流动的数据。数据以评论,图像,社交状态等形式收集和观察。
公司使用大数据技术来了解客户需求并检查他们在社交媒体上的言论。这有助于公司分析并制定有利于公司发展的战略。
天气
大数据技术用于预测天气预报。气候需要大量数据,平均值可用来预测天气这对预测洪水等自然灾害有用。
公共部门
大数据被用于许多政府和公共部门。大数据提供了许多设施,如电力调查,经济促进等。
大数据用于许多其他情况,如教育部门,保险服务,运输。安全情报等大数据已成为分析的重要组成部分,是了解业务增长和制定战略以帮助其进一步发展所必需的。