专栏名称: dbaplus社群
围绕Database、BigData、AIOps的企业级专业社群。资深大咖、技术干货,每天精品原创文章推送,每周线上技术分享,每月线下技术沙龙,每季度Gdevops&DAMS行业大会.
今天看啥  ›  专栏  ›  dbaplus社群

还纠结实时数仓选型,Spark +ClickHouse让你拍案叫绝!

dbaplus社群  · 公众号  ·  · 2021-05-13 07:15
众所周知,爱奇艺拥有海量视频,在视频生产过程中产生的上千QPS的实时数据、T级别的数据存储。要支持这样的数据进行即席查询和多个大表的JOIN,是爱奇艺视频生产团队大数据应用的难点。具体来说有以下几点:实时性的要求,需要实时的解决方案。生产数据更新频繁,OLAP 需支持更新。生产需要大表 Join 方案。码流属性(亿级,百G)和节目属性(亿级,百G)经常放在一起做分析。此外,爱奇艺视频生产数据还有一个特点,数据来源于OLTP 数据中台,其数据持久化在 Mongo,消息变动写入 Kafka, Kafka中:curData 是当前更新数据,oriData是历史为变动数据,这样的结构化数据为配置化开发提供了可能。爱奇艺视频生产团队负责爱奇艺的视频生产,涵盖“素材、成片、运营 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照