文章预览
十多年来,组织一直在采用数据湖来克服数据仓库的技术限制,并逐步向更以数据驱动的实体发展。虽然许多组织利用数据湖探索新的数据使用案例并改进了数据驱动方法,但其他组织发现很难获得所承诺的收益。因此,许多数据湖计划的效率和投资回报率受到了质疑。 规避陷阱:当数据湖变成“数据沼泽” 随着一些组织在管理大量数据存储和避免“数据沼泽”方面面临挑战,科技界对数据湖的看法已经发生了变化。在“数据沼泽”中,数据虽然被存储但未被使用。这些“数据沼泽”是大型存储库,数据被无差别地倾倒其中,导致可发现性和可用性问题。集中化管理可能会造成瓶颈,从而减慢访问和分析速度,但如果缺乏严格的治理,数据质量会迅速恶化。此外,对于数据湖实行一刀切办法,实际无法满足不同业务领域的具体需求。由于缺乏适
………………………………