Clickhouse—MergeTree 数据生命周期
今天我们介绍一下MergeTree的数据的生命周期,其实我们知道数据的生命周期管理其实是数据治理的一个环节,我们在数仓中管理数据的生命周期主要是为了节约存储,实现的主要方式是冷热分离,对不常用的数据我们可以进行压缩归档。
1 数据 TTL
- TTL(Time To Live)表示数据的存活时间,在 Merge 中可以为某个字段或者整个表设置TTL。
- 如果设置列级别的 TTL,那么到期时会删除这一列的数据
- 如果设置表级别的 TTL,那么到期时会删除整个表的数据
- 如果同时设置了列级别和表级别的 TTL,那么会以先到期的为主。
- 无论是列级别还是表级别的 TTL 都要依靠 DateTime 或 Date 类型的字段,通过对这个字段的 Interval 操作,来表述 TTL 的过期时间。
- INTERVAL 的完整操作包括:SECOND、MINUTE、HOUR、DAY、WEEK、MONTH、QUARTER 和 YEAR,前面我们其实介绍过INTERVAL 的数据类型,可以参考Clickhouse—基础数据类型
TTL create_time + INTERVA