ClickHouse(10)ClickHouse合并树MergeTree家族表引擎之ReplacingMergeTree详细解析


目录
  • ClickHouse(09)ClickHouse合并树MergeTree家族表引擎之MergeTree详细解析

    数据处理策略

    最后总结一下ReplacingMergeTree引擎的数据处理策略,主要是下面五个点。

    1. 使用ORBER BY排序键作为判断重复数据的唯一键。
    2. 只有在合并分区的时候才会触发删除重复数据的逻辑。
    3. 以数据分区为单位删除重复数据。当分区合并时,同一分区内的重复数据会被删除;不同分区之间的重复数据不会被删除。
    4. 在进行数据去重时,因为分区内的数据已经基于ORBER BY进行了排序,所以能够找到那些相邻的重复数据。
    5. 在数据合并的时候,ReplacingMergeTree 从所有具有相同排序键的行中选择一行留下:如果ver列未指定,保留最后一条。如果ver列已指定,保留ver值最大的版本。

    资料分享

    ClickHouse经典中文文档分享

    参考文章

    • ClickHouse(01)什么是ClickHouse,ClickHouse适用于什么场景
    • ClickHouse(02)ClickHouse架构设计介绍概述与ClickHouse数据分片设计
    • ClickHouse(03)ClickHouse怎么安装和部署
    • ClickHouse(04)如何搭建ClickHouse集群
    • ClickHouse(05)ClickHouse数据类型详解
    • ClickHouse(06)ClickHouse建表语句DDL详细解析
    • ClickHouse(07)ClickHouse数据库引擎解析
    • ClickHouse(08)ClickHouse表引擎概况
    • ClickHouse(09)ClickHouse合并树MergeTree家族表引擎之MergeTree详细解析
    • ClickHouse(10)ClickHouse合并树MergeTree家族表引擎之ReplacingMergeTree详细解析
    • ClickHouse(11)ClickHouse合并树MergeTree家族表引擎之SummingMergeTree详细解析