首页
解决方案
数据库专业技术服务全栈式PostgreSQL解决方案Oracle分布式存储化数据库云PolarDB一体化解决方案
产品
CLup:PostgreSQL高可用集群平台 CMiner: PostgreSQL中的CDC CData高性能数据库云一体机 CBackup数据库备份恢复云平台 CPDA高性能双子星数据库机 CSYun超融合虚拟机产品 ZQPool数据库连接池 ConshGuard数据保护产品 APCC: Greenplum管理平台
文档
文章
客户及伙伴
中启开源
关于我们
公司简介 联系我们
中启开源

1. 背景

在开源技术领域,每一次的风吹草动都足以引起业界的广泛关注。近日,一则消息如同一枚重磅炸弹,在数据库界掀起了不小的波澜——著名开源MPP(大规模并行处理)数据库Greenplum的公开GitHub仓库突然归档,原先的PR和TAG都无法访问,引发了业界内外的诸多猜测与讨论。让人回想起Greenplum自被半导体巨头博通(Broadcom)收购以来,经历的多次大规模裁员风波,不禁让人担忧其开源承诺的未来走向。初步分析看,博通会将Greenplum闭源,

Greenplum Database 自 2003 年诞生起至今已有超过 20 多年的演进历史,自其 2015 年宣布开源以来至今已有近 10 年的发展历史。Greenplum 基于 PostgreSQL并采用大规模并行处理架构(MPP)打造的、支持 PB 量级的分布式数据仓库系统,也影响了其他后来同类产品的发展。Greenplum Database 拥有众多丰富的用户案例,在包括金融、电信运营商、制造业等在内的众多行业落地并扮演关键的数据平台角色,历经数十年打磨,成为最为成熟的数据仓库和大规模数据分析解决方案之一。长期以来,Greenplum的开源版本为促进技术交流、创新及社区建设做出了不可磨灭的贡献。

2. 用户的选择

在这个日新月异的数据时代,每一个技术的变迁都预示着新的机遇与挑战。Greenplum的闭源让众多依赖其强大分析能力的用户和开发者陷入了深思。面对这一变局,寻找一个稳定可靠、功能强大且持续开源的替代方案显得尤为重要,而Cloudberry Database正逐渐成为众多使用Greenplum企业的首选。

3. CloudberryDB介绍

Cloudberry Database 是专门面向 AI 和分析场景打造的一款开源数据库,团队由 Greenplum Database 原始开发团队成员和 PostgreSQL 贡献者组成。作为 Greenplum Database 的衍生版,Cloudberry Database 与 Greenplum Database 保持原生兼容,并能实现无缝迁移,具备更新的内核和更丰富的功能。最新的Greenplum7.1是基于PostgreSQL 12的内核构建的,而Cloudberry Database是基于PostgreSQL14.4的内核构建的,这意味着它继承了PostgreSQL14的功能。Cloudberry Database除了拥有Greenplum的全部功能外,其还有如下一些独特的功能:

  1. 单segment上的查询并行化: 我们知道在原先的Greenplum中,为了让单条大SQL能并行跑的更快,需要在规划时在单台机器上规划更多的segment节点,但很多时候也不能太多,因为如果单台机器上建立的segment数目太多,会导致master节点不能承担太多的连接数,通常单台机器上建立的segment数为4主4备、6主6备,如果让单台机器上segment太多很容易出现问题。但是单个segment节点上这个SQL还是只有一个进程处理。所以一旦集群建立完成后,一条SQL的并行度就被固定住了。如果想增加并行度,只能通过扩容的方式增加segment节点数,这是很不方便的。而使用Cloudberry database之后,可以直接用参数指定在单个segment节点上的并行度了,这样可以做到执行不同的SQL时指定不同的并行度,大大增加了灵活性。
  2. Btree索引改进: 因为内核是PostgreSQL 14,所以继承了PostgreSQL 14的Bree优化的特性了,如Btree索引比以前更小更快了。
  3. 支持BRIN索引: 使用PostgreSQL的人们都知道BRIN索引是一个好东西,对于一些有规律的插入的数据来说,通常可以使用BRIN索引,而BRIN索引通常比Btree索引小很多。
  4. postgres_fdw的聚合下推: 在CloudBerryDB中使用postgres_fdw可以下推聚合,这大大方便了与PostgreSQL数据库和其它CloudberryDB的数据互操作。
  5. 加列后无需重写表: 被DDL苦过的人们都知道此功能多么重要。
  6. 对AppendOnly表也可以做索引扫描: 使用过Greenplum的人都知道,很多时候AO表走不了索引,目前这个限制在CloudberryDB中没有了。
  7. 直接支持REINDEX CONCURRENTLY:以前在线加索引操作上有点烦,需要建一个新索引,然后再删除旧索引的方式进行,现在不需要了。
  8. toast表的压缩算法支持LZ4:LZ4是又想用压缩,又担心CPU性能不够的朋友们的福音。
  9. CTE语句支持SEARCH子句和CYCLE。SERCH子句可以让CTE走深度优先还是广度优先,而CYCLE子句可以防止CTE中的死循环。
  10. COPY FROM支持where过滤子句了,在导入数据时也可以过滤数据了。
  11. 提供了工具pg_verifybackup可以验证备份的完整性。

还有更多的功能请见:https://cloudberrydb.org/docs/cbdb-vs-gp-features

综上所述,Cloudberry Database以其强大的分析处理能力、灵活的部署选项、开源生态的活力以及对现有Greenplum用户的友好兼容性,成为了现代用户的不二选择。

迁移到CloudberryDB

如果您正考虑从Greenplum迁移至Cloudberry Database,或有任何关于数据库迁移的疑问,欢迎随时联系我们。让我们携手,为您的数据旅程注入新动力,共同迎接更加高效、智能的数据处理未来。

乘数科技的专业迁移服务,让您无忧:

  1. 定制化迁移策略:我们的专家团队将深入分析您的现有系统,量身定制最适合您的迁移方案,确保数据迁移的安全与高效。
  2. 全程技术支持:从迁移前的评估、规划,到迁移过程中的实施、监控,直至后期的优化与维护,【乘数科技】提供全方位的技术支持,每一步都专业到位。
  3. 最小化业务中断:利用先进的迁移工具和策略,我们致力于在保证数据完整性的前提下,最大限度减少迁移期间的业务中断,保障企业运营的连续性。
  4. 后续优化与培训:迁移完成后,我们将协助您进行系统优化,提升性能,并提供Cloudberry Database的操作培训,确保您的团队能够快速上手,充分利用新平台的优势。

联系我们请拨打咨询热线:400-887-8716