博客

结构化或非结构化数据:差异何在?

由LaurenWahlman编写

| 分钟内

今日企业依赖数据运行最成功的企业找到了高效方法使用数据深入了解它们的运行过程

挑战在于存储、管理并保护指数增长数据并给传统存储系统加压

管理数据的第一步是理解数据的不同类型和这些差异为何重要两大类数据结构化非结构化两种类型可以多方式帮助业务, 即使组织管理方式大相径庭

结构化数据

结构化数据即信息可整洁整理成集结构,例如带行列的电子表格最常用实例是关系数据库,例如用于布置零售产品订单、预订酒店或开立检验或存取账户的数据库。关系数据库和结构化数据通常由ERP、CRM、MDM、EMI等应用消化

想想我们最常使用的信息计算机:客户名或病人名和地址、电话号码、信用卡号与过期日期、社保号、金融交易和产品名与SKU号这些都是结构化数据的良好例子

结构化数据易于搜索并高度组织化,机器很容易处理用户可输入数据,通过数据库搜索并按自己的意愿修改使用数据,通常使用关系数据库管理系统或结构查询语言SQL,这是一种程序设计语言,专为管理结构数据设计

结构化数据优缺点

结构化数据的主要长处有:

  • 人文可读性人很容易读取并视觉化结构数据 整洁整理成行列

  • 机器很容易处理、操作和查询结构化数据很容易为机器所理解,其组织化并特别使它最理想机器学习数据集

  • 不需要专业训练使用企业员工熟悉数据数据库结构 不需要理解基础关系使用并从中受益

  • 前后最长 多可用工具远在计算机制定标准前-开发者创建了许多工具平台存储、使用、管理和分析结构化数据

  • 很容易安全数据库供应商开发内部控件 保护结构化数据 避免网络威胁

结构化数据使用也有一些缺陷,其中包括:

  • 整体缺乏数据弹性由于其具体预定义性质,结构化数据通常只能用于原创目的很难使用数据库 并使用它

  • 需要嵌入僵硬模式多数结构化数据存储于数据仓库 表示很难修改数据 缩放性不简单

  • 无法增加存储容量关系数据库无法轻易发展存储能力储存结构化数据,因为这会伤害查询和转转应用性能

何为非结构化数据

了解结构化数据后,很容易理解非结构化数据概念-它基本就是所有东西包括不整洁地排列格式的所有数据,例如音频录制、视频视频、图像、社交媒体发布、电子邮件内容、客服聊天记录、机器传感器数据等等Gartner估计非结构化数据约占企业数据80%,而其他一些估计甚至更高

非结构化数据可由人或机器生成人造信息可包括音频文件、视频如YouTube内容监控、照片、保健成像和短信机器生成数据可包括来自涡轮机、飞机引擎、IOT、电工、系统日志、交通或天气等或卫星图像、数字监控文件或大气数据等传感器数据

非结构化数据没有预定义数据模型,为结构化数据开发的传统数据工具无法处理或分析

非结构化数据往往以原始形式存储于个人缩图驱动器、本地服务器、数据湖等需要专业高级工具与解决方案分析这类数据并提取值,形式为对企业、机器、流程等方方面面可操作深入了解

取值挑战值得大数据解析学之所以如此高调 是因为深入广域非结构化数据库通过高级数据解析和数据挖掘,企业可处理非结构化数据识别客户购买行为,例如按季节或时或分析驱动者跨城公路交通模式以确定何地、何时和何因出现瓶颈或处理社交媒体文章以理解客户对品牌感知方式或对特定产品感知方式或执行预测分析机数据等

分析洞察力有可能使组织业务和服务发生革命深入深入了解数据后,企业可获取高度竞争优势,发现新收入流的契机,并前所未有地提高客户服务,降低维护成本和故障时间举几个例子

非结构化数据优缺点

处理非结构化数据有利有弊非结构化数据除了有可能提供深入改变游戏对过程和客户习惯的洞察力外,优点包括:

  • 更多弹性使用方式非结构化数据以原生格式存储,使用前无需定义表示它可以适应各种使用案例

  • 很容易收集因为它不需要预定义快速简单进组织后处理

  • 存储器可大规模缩放数据湖随数据量增长很容易缩放

缺陷包括:

  • 需要专业数据科学技巧非结构化数据不能由员工分析处理其非定义性质和广度格式要求理解数据本身以及它与其他数据的关系

  • 需要专用工具非结构化数据分析仍然相当新奇,因此可用工具平台组织、管理和分析信息仍在完善和完善中

  • 不容易缩放存储器存储和管理非结构化数据需要文档和对象存储,并需要各种商业智能和分析应用传统存储器无法存储和规模化大规模增长非结构化数据

相关

GartnerQQ识别Nutanix视觉

magicQuarantTM分布式文件系统与对象存储

非结构化 vs结构化数据:快速比较

从以上各节可以看出,结构化非结构化数据彼此大相径庭并需要不同的工具来管理处理

理解差别的一个简单方法就是说结构化数据通常被视为量化数据-高度整理和格式化并易查找关系数据库-它能帮助企业发现对象、地点和时间向用户提供三万尺视图非结构化数据非定性数据非定义性、非格式化和难以搜索和处理可帮助解答问题方式和原因深入了解客户行为甚至意图

数据管理

结构化数据易于整理处理典型所有基于文本预定义并完全适应关系数据库行列非结构化数据可以多种形式出现,从音频到视频到文本到图像等等,组织化和处理难度更大。

数据存储

如前所述,结构化数据编成关系数据库,并往往储存在数据仓库内并装有严格存储格式非结构化数据由多格式文件类型组成大团圆,并往往存储在数据湖中,不需要预定义或格式化

数据分析

结构化数据解析过程非常成熟,开发者长到可以创建许多有效工具平台非结构化数据解析仍被视为开发行业,工具平台不成熟还需要专门知识和技能分析非结构化数据

用例

带电子表格的任何使用案例均显示结构化数据使用案例例举 :

  • 库存控制系统

  • 销售点和零售交易数据

  • 在线预订系统宾馆、航空公司、音乐会或其他事件

  • 通用会计实践

  • 在线银行业务

  • 客户关系管理

  • 机构资源规划

  • 企业病人主指数

非结构化数据用于想执行预测解析、检测机器数据异常或用户/客户行为,确定质量特征,如公共舆论或产品有效性等其它使用实例包括:

  • 通过分析异常行为数据预防、检测或恢复网络攻击

  • 执行机器数据预测解析以降低维护成本和故障时间

  • 分析音视频客户交互记录册提高支持度和客户满意度

  • 分析应用摄取数据提高性能

  • 测量营销运动效果

  • 通过分析社交媒体文章和评审网站识别潜在购买趋势

  • 通过文本挖掘聊天或邮件检测员工满意度

  • 通过文本分析增强聊天机能力,使客户获取正确资源

  • 自然语言处理以确定客户对产品或品牌的情感

半结构化数据是什么

结构化和无结构化数据是两种最常见的信息类型,但也有一个称为半结构化数据类别基本非结构化数据 伴之以元数据 分解信息方式多亏元数据,用户更容易分类搜索分析信息,多如结构化数据

介于结构化非结构化数据这两个极端间,半结构化数据并不符合固定或僵硬数据模式,但结构特征仍然相似。元数据使半结构化数据比非结构化数据更容易搜索、存储和组织的关键

类似非结构化数据,缺少结构化数据使半结构化数据难以机器解析

半结构化数据常用实例是邮件内容邮件无法整理成关系数据库, 但它确实有内在元数据, 用户可以搜索关键字而不需要更高级工具侧重于简化数据传输的其他使用案例,如共享传感器数据、电子数据交换和文档标记语言

Nutanix数据托管

智能可缩混合云解决方案Nutanix专为今日企业设计的一系列解决方案可以简化存储、管理和分析结构化非结构化数据解决方案包括:

  • 伟德betvictor1946 提供非结构化数据从假设云分层处理,2x存储性能提高数据库工作量和3x大数据工作量-均不要求复杂重构

  • Nutanix统一存储-软件定义存储平台整合无缝存取和管理单平台利用Nutanix云平台,NUS构建时用于核心、云或边缘部署的现代应用的规模、性能和综合数据安全需求

  • 努坦伊斯文件软件定义平台消除存储筒仓并简化管理,单击自动化帮助客户易标度而无损性能网络安全综合保护Nutanix文件处于独特位置保护非结构化数据

  • Nutanix对象简单扩展S3兼容对象存储现代云原生大数据应用易用、高性能、安全灵活多云部署Nutanix对象是一个统一灵活平台,存储文件、块块、VM和许多其他类型的工作量

  • 核素卷卷块存储连接物理和虚拟基础设施合并成单一平台 简单化企业依赖

  • Nutanix数据镜头非结构化数据治理服务 帮助简化数据生命周期管理 并保护不受赎金软件攻击

  • Nutanix数据库服务数据库服务提供单击存储缩放和丰富角色访问控制伟德1946客户端下载 数据库引擎环境如PostgreSQLQQLQMYSQLQSQSLSWQSQLSERVSQLSLSOCLLDOLCL

并使用套产品应用数据库自动化、微分化和远为加速商业结果,同时永不失去简洁高性能的允诺。

Tejas Mehta
CTORBL银行

2022Nutanix公司所有权利保留Nutanix标识和Nutanix所有产品、特征和服务名称均注册Nutanix公司商标美国和其他国家此处提及的其他商标名仅用于识别目的,并可能为各自持有人的商标内存外部网站链接非Nutanix.comNutanix不控制这些网站并免责所有外部网站内容或精度的责任连接外部网站的决定不应被视为认可网站内容本文章中的某些信息可能与研究、出版物、调查和其他从第三方来源获取的数据以及我们自己内部估计和研究相关或基础第三方研究、出版物、调查和其他数据自发布日期起即为可靠, 但尚未独立验证,

或含有明示或隐含前瞻声明,此类报表的准确性涉及风险和不确定性,并取决于未来事件,包括可能超出我们控制范围的事件,实际结果可能与此类报表预期或隐含的实际结果有实质上和不利的差异。本文所列任何前瞻声明均自此日期起发言,除法律规定外,我们不承担更新或以其他方式修改任何前瞻声明以反映后续事件或情况的义务。

Baidu