专栏名称: ruby的数据漫谈
从事互联网数据平台相关工作多年,也是一名数据产品人,聊聊数据平台、数字化转型,数据治理,人工智能等话题,欢迎关注我的公众号,一起成长。
今天看啥  ›  专栏  ›  ruby的数据漫谈

数据开发中的引擎如何访问数据湖中的数据?

ruby的数据漫谈  · 公众号  ·  · 2024-09-21 17:04

文章预览

摘要: 在现代大数据架构中,数据湖作为一种集中式存储库,用于存储结构化和非结构化数据,它的重要性日益凸显。数据湖的核心优势在于其能够提供统一的元数据管理,使得不同的数据处理引擎能够高效地访问和操作数据 。引擎访问数据湖的数据,涉及到的基本原理是引起需要可以访问数据湖的统一元数据库,操作数据湖的表,元数据都存储在统一的元数据库中,而访问数据湖的数据的时候,则是需要和数据湖的管理引擎结合,管理引擎管理数据湖的表格式,可以通过元数据找到数据存储的具体位置,从而进行后续的增删改查的操作。因此引擎可以操作数据湖的数据需要引擎可以把访问统一的元数据库,且数据湖的管理引擎需要支持把元数据存储到元数据库,另外引擎和数据湖的管理引擎需要兼容,本文将以flink引擎为例说明flink引擎如何访 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览