Ebpay

Ebpay Ebpay大数据问答 数据湖概念溯源
我要提问
写回答

数据湖概念溯源

企业数字化转型 共 1 个回答
  • 口头爱人
    口头爱人

    2022-11-11

    数据湖(Data Lake)是一个存储企业的各种各样原始数据的大型仓库,其中的数据可供存取、处理、分析及传输。数据湖是以其自然格式存储的数据的系统或存储库,通常是对象blob或文件。数据湖通常是企业所有数据的单一存储,包括源系统数据的原始副本,以及用于报告、可视化、分析和机器学习等任务的转换数据。数据湖可以包括来自关系数据库(行和列)的结构化数据,半结构化数据(CSV,日志,XML,JSON),非结构化数据(电子邮件,文档,PDF)和二进制数据(图像,音频,视频)。

    现在,Hadoop是最常用的部署数据湖的技术,所以很多人会觉得数据湖就是Hadoop集群。但其实数据湖是一个概念,而Hadoop是用于实现这个概念的技术。

您可能需要的数据产品
亿信ABI 亿信ABI 亿信ABI
免费云体验

可免费试用30天

已有30000+人申请

Ebpay助力政企数字化转型

现在申请试用Ebpay数据软件,马上可取得:

50+

领导驾驶舱、大屏分析等BI模板

100+

多行业数字化转型解决方案

1500+

海量工具及行业应用学习视频

立即申请试用
customer

在线咨询

在线咨询

点击进入在线咨询