今天看啥  ›  专栏  ›  大淘宝技术

FlinkSQL之temporary join开发

大淘宝技术  · 公众号  ·  · 2024-10-25 18:42
    

文章预览

在实时开发中,双流join获取目标对应时刻的属性时,经常使用temporary join。笔者在流量升级的实时迭代中,需要让流量日志精准的匹配上浏览时间里对应的商品属性,使用temporary join开发过程中踩坑不少,将一些经验沉淀在此文中,供各位同学参考与交流。 背景介绍 关于实时flinkSQL的双流join的背景知识可以先阅读以下文章: https://www.51cto.com/article/713922.html 目前我们有一条流量日志明细的TT流A,以及一条商品标签的TT流B,在flink中对A流和B流进行双流join类似于将A流关联一个hbase维表。temporary join有以下特点: 1. 单流驱动:虽然是双流join,但数据下发只由一条流驱动。 2. 需要定义versioned table,versioned table记录了每个时刻的属性信息,双流join时被动查询。类似于银行汇率表,在货币兑换的时候需要参考兑换时刻的汇率。 3. 查询携带时间版本信息:tempo ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照
总结与预览地址:访问总结与预览