首页
解决方案
数据库专业技术服务全栈式PostgreSQL解决方案Oracle分布式存储化数据库云PolarDB一体化解决方案
产品
CLup:PostgreSQL高可用集群平台 CMiner: PostgreSQL中的CDC CData高性能数据库云一体机 CBackup数据库备份恢复云平台 CPDA高性能双子星数据库机 CSYun超融合虚拟机产品 ZQPool数据库连接池 ConshGuard数据保护产品 APCC: Greenplum管理平台
文档
文章
客户及伙伴
中启开源
关于我们
公司简介 联系我们
中启开源
登录
×
修改密码

RisingWave 是一款开源的云原生流式数据库(Streaming Database),专为简化实时数据管道的开发、部署和运维而设计。它由奇点无限(Singularity Data)公司开发,于2022年开源,旨在解决传统流处理系统(如 Apache Flink)复杂度高、运维难、成本高等痛点。

RisingWave 的核心理念是“让流处理像使用数据库一样简单”。用户可以使用标准的 SQL 语言来定义数据源、进行实时计算和查询结果,而无需编写复杂的代码或管理庞大的分布式系统。

可以用PostgreSQL的客户端psql直接连接RisingWave,用起来像是一个PostgreSQL数据库,但实际他主要在大数据领域使用,用作实时流计算(即与flink一个领域)。

以下是关于 RisingWave 的详细介绍:

1. 核心定位与特点

2. 核心功能与优势

A. 极简的开发体验 (SQL Everything)

在 RisingWave 中,一切皆表。

B. 强大的实时计算能力

C. 运维与成本优势

3. 典型应用场景

  1. 实时数仓与 BI 报表

    • 替代传统的 T+1 离线数仓,实现秒级更新的实时大屏和报表。
    • 例如:实时销售监控、网站流量分析、广告效果归因。
  2. 实时监控与告警

    • 对 IoT 设备数据、服务器日志进行实时异常检测和阈值告警。
    • 例如:金融反欺诈交易监控、工厂设备故障预警。
  3. 实时特征工程 (AI/ML)

    • 为在线机器学习模型提供实时的特征数据。RisingWave 可以持续计算用户行为特征,并推送到特征存储或直接供模型调用。
    • 例如:推荐系统中的用户实时兴趣画像、风控模型中的实时交易特征。
  4. 数据同步与 CDC (Change Data Capture)

    • 作为强大的 CDC 工具,将数据库(如 MySQL, PostgreSQL)的变更实时同步到数据湖(Iceberg, Hudi)或其他数据库中,并进行简单的清洗转换。
  5. 事件驱动的应用后端

    • 直接作为应用的后端数据库,支撑需要实时状态查询的业务逻辑。

4. 架构原理简述

RisingWave 的架构主要包含以下组件:

5. 与其他技术的对比

特性 RisingWave Apache Flink ksqlDB / Spark Streaming 传统数据库 (MySQL/PG)
主要定位 流式数据库 流处理引擎 流处理/查询层 事务型/分析型数据库
使用方式 标准 SQL Java/Scala/SQL SQL SQL
状态管理 自动托管 (存算分离) 需配置 State Backend 依赖外部或有限 本地存储
查询能力 强 (支持任意时刻即席查询) 弱 (主要输出到 Sink) 中等 强 (但在海量实时写入下性能下降)
运维复杂度 低 (云原生,自动扩缩容) 高 (需调优 Checkpoint, 资源等) 中/高 低 (但难以应对流式场景)
数据时效性 毫秒级 毫秒级 秒级/分钟级 取决于写入方式

6. 总结

RisingWave 代表了数据处理架构的一种新范式:流式优先 (Streaming First)。它试图证明,在绝大多数实时数据处理场景中,不需要维护复杂的 Lambda 架构(离线 + 实时两套链路),也不需要精通 Flink 这样的重型框架。通过提供一个易用、高性能、低成本且兼容 PostgreSQL的流式数据库,RisingWave 让开发人员能够专注于业务逻辑本身,用简单的 SQL 就能构建出强大的实时数据应用。

如果你正在寻找一种能够替代 “Kafka + Flink + Druid/ClickHouse” 复杂栈的解决方案,或者希望将现有的离线数仓升级为实时数仓,RisingWave 是一个非常值得考虑的选择。