TimescaleDB 查询优化

SunnyFan大约 11 分钟约 3389 字

TimescaleDB 查询优化

简介

TimescaleDB 基于 PostgreSQL 扩展，专门面向时序数据场景做了分块（chunk）、压缩、连续聚合和保留策略增强。要把 TimescaleDB 用好，重点不是简单把表改成 hypertable，而是围绕时间维度、设备维度、聚合粒度和冷热数据治理设计查询与索引策略。

TimescaleDB 的核心设计理念是：时序数据天然按时间排序且写入后很少修改，因此可以通过自动分区（chunk）、列式压缩和预聚合来大幅提升查询性能和降低存储成本。但如果不理解这些机制的工作原理，可能会遇到查询变慢、压缩失败或连续聚合数据不准确等问题。

Hypertable 存储架构

Hypertable（用户视角）          实际存储（Chunk）
┌─────────────────────┐
│  sensor_metrics      │    ┌──────────────────┐
│  (逻辑表)            │───→│ _hyper_1_1_chunk  │  2024-01
│                      │    │ (2024-01-01 ~     │
│                      │    │  2024-01-31)      │
│                      │    └──────────────────┘
│                      │    ┌──────────────────┐
│                      │───→│ _hyper_1_2_chunk  │  2024-02
│                      │    │ (2024-02-01 ~     │
│                      │    │  2024-02-29)      │
│                      │    └──────────────────┘
│                      │    ┌──────────────────┐
│                      │───→│ _hyper_1_3_chunk  │  2024-03
│                      │    │ (2024-03-01 ~     │
└─────────────────────┘    │  2024-03-31)      │
                           └──────────────────┘

查询带时间条件时：
  WHERE ts >= '2024-02-01' AND ts < '2024-03-01'
  → 只扫描 _hyper_1_2_chunk（分区裁剪）
  → 跳过其他所有 chunk

特点

1.Hypertable 分块 — 按时间自动拆 chunk，适合海量时序写入
2.连续聚合 — 常用统计结果预聚合，降低报表查询成本
3.保留与压缩策略 — 支持历史数据自动压缩和清理
4.time_bucket 友好 — 时间窗口分析更方便
5.基于 PostgreSQL — 兼顾 SQL 能力与时序优化能力

实现

Hypertable 建立与基础查询

-- 创建普通表
CREATE TABLE sensor_metrics (
    ts              TIMESTAMPTZ NOT NULL,
    device_id       BIGINT NOT NULL,
    metric_name     TEXT NOT NULL,
    metric_value    DOUBLE PRECISION NOT NULL,
    site_id         BIGINT NOT NULL
);

-- 转换为 Hypertable（按时间分块）
SELECT create_hypertable('sensor_metrics', 'ts');

-- 转换为 Hypertable 时指定空间分区（可选）
-- 将数据按设备 ID 进一步分区到不同 chunk
SELECT create_hypertable('sensor_metrics', 'ts',
    partitioning_column => 'device_id',
    number_partitions => 4
);
-- 适合设备数量多且均匀分布的场景，提高并发写入性能

-- 常用索引：时间 + 设备
CREATE INDEX idx_sensor_metrics_device_ts
ON sensor_metrics (device_id, ts DESC);

CREATE INDEX idx_sensor_metrics_site_metric_ts
ON sensor_metrics (site_id, metric_name, ts DESC);

-- 复合索引设计原则：
-- 时间维度放在最后（DESC），配合范围查询
-- 高频过滤维度放在前面（device_id、site_id）
-- 不要建太多索引，时序写入场景索引越多写入越慢

-- 近 24 小时设备温度
SELECT ts, metric_value
FROM sensor_metrics
WHERE device_id = 1001
  AND metric_name = 'temperature'
  AND ts >= NOW() - INTERVAL '24 hours'
ORDER BY ts DESC;

-- ⚠️ 性能关键：查询必须带时间范围条件
-- 不带时间条件的查询会扫描所有 chunk
SELECT ts, metric_value
FROM sensor_metrics
WHERE device_id = 1001;
-- 这个查询会扫描所有 chunk（极慢）
-- 改进：加上合理的时间范围
SELECT ts, metric_value
FROM sensor_metrics
WHERE device_id = 1001
  AND ts >= NOW() - INTERVAL '7 days';

-- 查看 chunk 裁剪情况
EXPLAIN ANALYZE
SELECT ts, metric_value
FROM sensor_metrics
WHERE device_id = 1001
  AND ts >= NOW() - INTERVAL '1 day';
-- 在执行计划中查看 "Chunk Exclusion" 信息
-- 理想情况：只扫描 1-2 个 chunk

-- 查看所有 chunk 信息
SELECT chunk_schema, chunk_name, range_start, range_end
FROM timescaledb_information.chunks
WHERE hypertable_name = 'sensor_metrics'
ORDER BY range_start DESC;

-- 查看 chunk 大小
SELECT
    chunk_name,
    pg_size_pretty(before_compression_total_bytes) AS raw_size,
    pg_size_pretty(after_compression_total_bytes) AS compressed_size
FROM timescaledb_information.chunks
WHERE hypertable_name = 'sensor_metrics'
ORDER BY before_compression_total_bytes DESC;

time_bucket 与连续聚合

-- time_bucket 是 TimescaleDB 提供的时间分组函数
-- 类似 PostgreSQL 的 date_trunc，但支持任意时间间隔

-- 每 5 分钟聚合一次平均温度
SELECT time_bucket('5 minutes', ts) AS bucket,
       device_id,
       AVG(metric_value) AS avg_temp,
       MAX(metric_value) AS max_temp
FROM sensor_metrics
WHERE metric_name = 'temperature'
  AND ts >= NOW() - INTERVAL '1 day'
GROUP BY bucket, device_id
ORDER BY bucket DESC;

-- time_bucket 支持的间隔：
-- '1 minute', '5 minutes', '1 hour', '6 hours'
-- '1 day', '1 week', '1 month'
-- 也可以自定义：INTERVAL '15 minutes'

-- time_bucket 支持自定义时区
SELECT time_bucket('1 hour', ts, 'Asia/Shanghai') AS bucket_cn,
       AVG(metric_value) AS avg_temp
FROM sensor_metrics
WHERE metric_name = 'temperature'
  AND ts >= NOW() - INTERVAL '1 day'
GROUP BY bucket_cn
ORDER BY bucket_cn DESC;

-- time_bucket_gapfill 填充缺失的时间窗口
SELECT
    time_bucket_gapfill('1 hour', ts, NOW() - INTERVAL '24 hours', NOW()) AS bucket,
    device_id,
    COALESCE(AVG(metric_value), 0) AS avg_temp,
    LOCATE('avg_temp', interpolation) AS interp_method
FROM sensor_metrics
WHERE device_id = 1001
  AND metric_name = 'temperature'
  AND ts >= NOW() - INTERVAL '24 hours'
GROUP BY bucket, device_id
ORDER BY bucket;
-- 没有数据的时间窗口会被填充 NULL 或使用插值

-- 连续聚合视图（Continuous Aggregate）
-- 核心思想：预计算常用聚合结果，查询时直接读聚合表
CREATE MATERIALIZED VIEW cagg_temp_5m
WITH (timescaledb.continuous) AS
SELECT time_bucket('5 minutes', ts) AS bucket,
       device_id,
       AVG(metric_value) AS avg_temp,
       MAX(metric_value) AS max_temp,
       MIN(metric_value) AS min_temp
FROM sensor_metrics
WHERE metric_name = 'temperature'
GROUP BY bucket, device_id;

-- 连续聚合的本质：
-- 1. 创建一个特殊的物化视图
-- 2. 后台定时刷新（增量计算新数据）
-- 3. 查询时直接读物化视图，不扫原始表

-- 查询连续聚合结果（直接查物化视图，性能极好）
SELECT *
FROM cagg_temp_5m
WHERE device_id = 1001
  AND bucket >= NOW() - INTERVAL '1 day'
ORDER BY bucket DESC;

-- 刷新策略
-- start_offset：从多久以前开始刷新（避免刷新正在写入的数据）
-- end_offset：刷新到多久以前（保留一个缓冲区给实时数据）
-- schedule_interval：多久刷新一次
SELECT add_continuous_aggregate_policy('cagg_temp_5m',
    start_offset => INTERVAL '2 days',
    end_offset   => INTERVAL '5 minutes',
    schedule_interval => INTERVAL '5 minutes');

-- 手动刷新连续聚合
CALL refresh_continuous_aggregate('cagg_temp_5m', NULL, NULL);

-- 刷新指定时间范围
CALL refresh_continuous_aggregate('cagg_temp_5m',
    '2024-01-01 00:00:00+08',
    '2024-01-31 23:59:59+08');

-- 查看连续聚合的刷新状态
SELECT view_name, job_id, schedule_interval,
       max_interval_per_job, proc_name
FROM timescaledb_information.continuous_aggregates;

-- 连续聚合的实时查询
-- 问题：连续聚合有 end_offset 延迟，最近 5 分钟的数据不在聚合中
-- 解决：使用 realtime 修饰符自动合并聚合数据与原始数据

-- 方法 1：创建带 realtime 的连续聚合（TimescaleDB 2.7+）
CREATE MATERIALIZED VIEW cagg_temp_5m_realtime
WITH (timescaledb.continuous, timescaledb.materialized_only = false) AS
SELECT time_bucket('5 minutes', ts) AS bucket,
       device_id,
       AVG(metric_value) AS avg_temp,
       MAX(metric_value) AS max_temp,
       MIN(metric_value) AS min_temp
FROM sensor_metrics
WHERE metric_name = 'temperature'
GROUP BY bucket, device_id;

-- 方法 2：手动合并实时数据
SELECT
    bucket,
    device_id,
    avg_temp,
    max_temp,
    min_temp
FROM cagg_temp_5m
WHERE device_id = 1001
  AND bucket >= NOW() - INTERVAL '1 day'
  AND bucket < NOW() - INTERVAL '5 minutes'

UNION ALL

SELECT
    time_bucket('5 minutes', ts) AS bucket,
    device_id,
    AVG(metric_value) AS avg_temp,
    MAX(metric_value) AS max_temp,
    MIN(metric_value) AS min_temp
FROM sensor_metrics
WHERE device_id = 1001
  AND metric_name = 'temperature'
  AND ts >= NOW() - INTERVAL '5 minutes'
GROUP BY bucket, device_id
ORDER BY bucket DESC;

多层级连续聚合

-- 场景：5 分钟 → 1 小时 → 1 天 的多层级聚合
-- 第一层：5 分钟聚合
CREATE MATERIALIZED VIEW cagg_5m
WITH (timescaledb.continuous) AS
SELECT time_bucket('5 minutes', ts) AS bucket,
       device_id,
       AVG(metric_value) AS avg_val,
       MAX(metric_value) AS max_val,
       MIN(metric_value) AS min_val,
       COUNT(*) AS sample_count
FROM sensor_metrics
GROUP BY bucket, device_id;

-- 第二层：基于第一层做 1 小时聚合
CREATE MATERIALIZED VIEW cagg_1h
WITH (timescaledb.continuous) AS
SELECT time_bucket('1 hour', bucket) AS bucket,
       device_id,
       AVG(avg_val) AS avg_val,
       MAX(max_val) AS max_val,
       MIN(min_val) AS min_val,
       SUM(sample_count) AS sample_count
FROM cagg_5m
GROUP BY bucket, device_id;

-- 第三层：基于第二层做 1 天聚合
CREATE MATERIALIZED VIEW cagg_1d
WITH (timescaledb.continuous) AS
SELECT time_bucket('1 day', bucket) AS bucket,
       device_id,
       AVG(avg_val) AS avg_val,
       MAX(max_val) AS max_val,
       MIN(min_val) AS min_val,
       SUM(sample_count) AS sample_count
FROM cagg_1h
GROUP BY bucket, device_id;

-- 查询时根据时间范围选择合适的聚合层级
-- 1 天内 → 查原始表或 cagg_5m
-- 1-7 天 → 查 cagg_5m 或 cagg_1h
-- 7-365 天 → 查 cagg_1h 或 cagg_1d
-- 1 年以上 → 查 cagg_1d

压缩、保留与冷热数据治理

-- 启用压缩
ALTER TABLE sensor_metrics SET (
    timescaledb.compress,
    timescaledb.compress_segmentby = 'device_id,metric_name',
    timescaledb.compress_orderby = 'ts DESC'
);

-- 压缩参数说明：
-- compress_segmentby：按哪些列分段压缩
--   相同 segmentby 值的行压缩在一起
--   查询时 WHERE 条件包含 segmentby 列效果最好
-- compress_orderby：段内排序方式
--   通常按时间降序，配合时间范围查询

-- 历史数据压缩策略（7天前自动压缩）
SELECT add_compression_policy('sensor_metrics', INTERVAL '7 days');

-- 手动压缩指定 chunk
SELECT compress_chunk(c)
FROM show_chunks('sensor_metrics', NOW() - INTERVAL '30 days', NOW() - INTERVAL '7 days') c;

-- 解压缩 chunk（需要修改历史数据时）
SELECT decompress_chunk(c)
FROM show_chunks('sensor_metrics', NOW() - INTERVAL '30 days', NOW() - INTERVAL '7 days') c;

-- 压缩效果查看
SELECT
    pg_size_pretty(before_compression_total_bytes) AS before,
    pg_size_pretty(after_compression_total_bytes) AS after,
    ROUND((1 - after_compression_total_bytes::numeric / before_compression_total_bytes) * 100, 1) AS compression_ratio
FROM timescaledb_information.chunks
WHERE hypertable_name = 'sensor_metrics'
  AND after_compression_total_bytes > 0
ORDER BY before_compression_total_bytes DESC
LIMIT 10;

-- 保留策略（90天前自动删除）
SELECT add_retention_policy('sensor_metrics', INTERVAL '90 days');

-- 修改保留策略
SELECT alter_job(job_id,
    schedule_interval => INTERVAL '1 day',
    max_runtime => INTERVAL '1 hour',
    config => jsonb_set(config, '{retention_period}', '"60 days"')
)
FROM timescaledb_information.jobs
WHERE proc_name = 'policy_retention';

-- 手动删除旧 chunk
SELECT drop_chunks('sensor_metrics', NOW() - INTERVAL '90 days');

-- 查看所有后台策略
SELECT job_id, proc_name, schedule_interval, config, next_run
FROM timescaledb_information.jobs
WHERE proc_name LIKE 'policy_%'
ORDER BY job_id;

-- 连续聚合的压缩
ALTER MATERIALIZED VIEW cagg_temp_5m SET (
    timescaledb.compress,
    timescaledb.compress_segmentby = 'device_id'
);

SELECT add_compression_policy('cagg_temp_5m', INTERVAL '7 days');
-- 连续聚合数据也可以压缩，进一步节省空间

查询优化实战

-- 场景 1：设备最新一条数据（每台设备取最新值）
-- 方法 1：DISTINCT ON（PostgreSQL 特有，高效）
SELECT DISTINCT ON (device_id)
    device_id, metric_name, metric_value, ts
FROM sensor_metrics
WHERE metric_name = 'temperature'
  AND ts >= NOW() - INTERVAL '24 hours'
ORDER BY device_id, ts DESC;

-- 方法 2：使用 LATERAL JOIN
SELECT d.device_id, m.metric_value, m.ts
FROM (SELECT DISTINCT device_id FROM sensor_metrics) d
CROSS JOIN LATERAL (
    SELECT metric_value, ts
    FROM sensor_metrics
    WHERE device_id = d.device_id
      AND metric_name = 'temperature'
    ORDER BY ts DESC
    LIMIT 1
) m;

-- 方法 3：窗口函数
SELECT device_id, metric_value, ts
FROM (
    SELECT device_id, metric_value, ts,
           ROW_NUMBER() OVER (PARTITION BY device_id ORDER BY ts DESC) AS rn
    FROM sensor_metrics
    WHERE metric_name = 'temperature'
      AND ts >= NOW() - INTERVAL '24 hours'
) t
WHERE rn = 1;

-- 场景 2：设备异常检测（值超过阈值）
SELECT device_id, metric_value, ts
FROM sensor_metrics
WHERE metric_name = 'temperature'
  AND metric_value > 85  -- 阈值
  AND ts >= NOW() - INTERVAL '1 hour'
ORDER BY ts DESC;

-- 确保有索引支持
CREATE INDEX idx_sensor_temp_value_ts
ON sensor_metrics (metric_name, metric_value, ts DESC)
WHERE metric_name = 'temperature';
-- 部分索引，只索引温度数据，索引更小

-- 场景 3：多设备对比（同比/环比）
-- 本月 vs 上月
SELECT
    time_bucket('1 day', ts) AS day,
    AVG(metric_value) AS current_month_avg
FROM sensor_metrics
WHERE device_id = 1001
  AND metric_name = 'temperature'
  AND ts >= DATE_TRUNC('month', NOW())
GROUP BY day
ORDER BY day;

-- 使用 LATERAL JOIN 做环比
SELECT
    current.day,
    current.avg_val AS current_avg,
    prev.avg_val AS prev_avg,
    ROUND((current.avg_val - prev.avg_val) / NULLIF(prev.avg_val, 0) * 100, 1) AS change_pct
FROM (
    SELECT time_bucket('1 day', ts) AS day, AVG(metric_value) AS avg_val
    FROM sensor_metrics
    WHERE device_id = 1001 AND ts >= DATE_TRUNC('month', NOW())
    GROUP BY day
) current
LEFT JOIN LATERAL (
    SELECT AVG(metric_value) AS avg_val
    FROM sensor_metrics
    WHERE device_id = 1001
      AND metric_name = 'temperature'
      AND ts >= current.day - INTERVAL '1 month'
      AND ts < current.day - INTERVAL '1 month' + INTERVAL '1 day'
) prev ON true
ORDER BY current.day;