在当今数据主导的商业环境里,企业对数据处理的敏捷性与分析的深度提出了更高要求,而传统数仓方案部署难度高,资源要求多,难以应对这些日益提升的标准。面临着对实时数据分析能力的迫切需求,及在严格控制成本的前提下,探索一种能够融合高效数据存储与快速数据分析的新一代解决方案显得尤为关键。正是基于这一紧迫需求,乘数科技推出了一项创新方案,该方案巧妙结合了阿里云PolarDB的强大数据库处理性能与乘数科技自主研发的ConshFS高性能网络文件系统,旨在为中型乃至小型项目量身打造一个平衡资源效率与运维经济性的数仓解决方案。
本解决方案特别注重在保证高性能的同时,优化资源利用与运维成本,部署和维护简单,非常适合那些寻求在有限预算内最大化数据价值的中小型数仓项目,重新界定了成本效益比,助力企业以更合理的投入,解锁数据洞察的广阔天地,推动业务智慧转型。
PolarDB PostgreSQL版(下文简称为 PolarDB-PG)是一款阿里云自主研发的云原生关系型数据库产品,100% 兼容 PostgreSQL,高度兼容Oracle语法(公有云版支持Oracle语法);采用基于 Shared-Storage 的存储计算分离架构,具有极致弹性、毫秒级延迟、HTAP 的能力和高可靠、高可用、弹性扩展等企业级数据库特性。同时,PolarDB 具有大规模并行计算能力,可以应对OLTP与OLAP混合负载,还支持时空、GIS、图像、向量、搜索、图谱等多模创新特性,有效应对企业对数据处理日新月异的需求。
极致弹性:存储与计算能力均可独立地横向扩展。
毫秒级延迟:
HTAP 能力:基于 Shared-Storage 的分布式并行执行框架,加速在 OLTP 场景下的 OLAP 查询。一套 OLTP 型的数据,可支持 2 套计算引擎:
ConshFS是乘数科技自研的下一代高性能网络文件系统,专为PolarDB-PG共享存储数据库集群打造,无需部署额外的共享存储系统,能充分利用高速低延迟IB网络和以太网带宽资源,具有高度扩展性、毫秒级延迟、性能优异、兼容性好,可靠性高等企业级特性。部署简单,后期维护成本低,非常适合作为中小型数仓的底层系统使用。
ConshFS的架构如下:
ConshFS作为专为PolarDB定制的网络文件系统,其设计精巧地融入了PolarDB架构之中,显著增强了数据库系统的整体性能与运维效率。以下是ConshFS与PolarDB集成后展现的几项关键优势:
测试环境如下:
主机 | CPU | 内存 | 网络 | 系统 | 说明 |
---|---|---|---|---|---|
cssrv5 | 40核 | 128G | 100G IB网络 | RockyLinux 8.9 | 部署PolarDB共享集群主节点+ConshFS Server |
cssrv10 | 40核 | 128G | 100G IB网络 | RockyLinux 8.9 | 部署PolarDB共享集群备库 |
为了防止硬盘读写瓶颈对测试的干扰,将相关数据库的文件都放到内存中:
mount -t ramfs -o size=128G ramfs /nvme9n1
使用下面的命令生成测试数据:
pgbench -i -s 100
使用下面的几个命令分别在cssrv10备库节点测试性能和网络吞吐情况
pgbench -c 64 -n -P 2 -T 60 -S postgres
pgbench测试结果如下:
测试内容 | tps | latency average | latency stddev |
---|---|---|---|
开一个64并发的pgbench测试 | 125686.5 | 0.507 ms | 0.162 ms |
开两个64并发的pgbench测试 | 172131.7 | 0.729 ms | 0.258 ms |
开四个64并发的pgbench测试 | 182105.9 | 1.072 ms | 0.770 ms |
网络流量情况如下:
测试内容 | rxpck/s | txpck/s | rxKB/s | txKB/s |
---|---|---|---|---|
开一个64并发的pgbench测试 | 399479.00 | 1194767.00 | 42904.22 | 1658842.38 |
开两个64并发的pgbench测试 | 624816.00 | 1871680.00 | 67112.93 | 2598886.25 |
开四个64并发的pgbench测试 | 640399.50 | 1919350.00 | 68788.23 | 2665105.22 |