ca88登录页面第一个开源的大规模并行数据库突然 404国内数仓市

  在没有任何公告的情况下,知名开源大规模并行处理 (MPP) 数据库 Greenplum 突然就“404”了,而有网友反馈之前还可以访问下载,今天已经打不开了。

  根据提示,5 月 24 日,Greenplum 源代码仓库的访问权限修改为了“只读”,同时还清空了原有的 branch、tag、pr、issue 等信息。

  Greenplum 号称是是业界第一个开源的大规模并行(MPP)数据库,目前在 DB-Engines 的全球排行榜上为列第 48 位。

  Greenplum 对国内数据库行业产生了影响深远,很多数据库公司创始人都曾在参与过 Greenplum 项目。

  比如,拓数派(PieCloudDB)创始人冯雷,曾任 Pivotal(中国)的创始人兼总经理;四维纵横(YMatrix)创始人姚延栋,曾是 Greenplum 北京研发中心总经理、Greenplum 中国开源社区创始人;偶数科技(OushuDB)创始人常雷,曾创建 Greenplum 数据库高级研究与开发中国团队;酷克数据(HashData)联合创始人兼 CEO 简丽荣,曾在 Pivotal 从事 Greenplum 的开发。

  对于 Greenplum 在社区的这一突然变化,酷克数据 HashData 研发 VP、Cloudberry Database 研发负责人杨瑜向 InfoQ 表示,严格来说这是源码归档,不是很多网友所说的“闭源”,但我们不清楚后续官方会采取什么动作。

  首先,对于现有 Greenplum 社区用户来说,面临后续无法更新、升级和获得安全支持。社区用户可能需要寻找替代方案,或者尝试自行解决遇到的问题,这无疑增加了技术团队的负担和成本。

  其次,可能影响当前国内数据仓库市场的竞争格局。目前国内有基于 Greenplum 的衍生版或云服务,如果团队自身没有良好的技术储备,较大依赖上游,将在后续竞争中逐渐退出,具备真正技术实力的团队会获得更多机会并加强地位。

  同时,本次事件也对上下游生态系统产生影响,一些开发者可能会转向其他数据仓库项目,相关服务商也会寻找新的合作伙伴。大多数 Greenplum 衍生产品都跟随 Greenplum 上游代码的变化,归档意味着引用 Greenplum 代码不那么容易了。

  对于该事件是否会对酷克数据(HashData)产生影响的疑问,杨瑜表示,其目前拥有除 VMware 之外的第二大 Greenplum 开发者团队,本次 Greenplum 归档事件对团队影响较小。

  有专家表示,这利好了国内同类数据库,不过因为利益相关,该专家并未表达更多。据悉,国内著名开源数据仓库还有 Doris、StarRocks、ClickHouse 等。

  另外,开源项目的主导权问题也引起了大家的关注。如今很多开源项目背后都是大公司在主导。在该事件发生后,有专家表示,开源项目还是要纳入基金会,公司管理的开源项目太容易受公司政策和存亡影响了。

  二十世纪末期,随着数据量开始增加,当时的数据仓库开始性能不足。解决方案除了 NoSQL、Hadoop,还有集群关系系统,即大规模并行处理系统。Greenplum 就是这一路线的典型代表。

  2010 年,MPP 数据库领域开始整合,许多小公司被大公司收购。EMC 在 2010 年 7 月收购了 Greenplum,当时 Greenplum 4.0 版本刚刚发布。EMC 将 Greenplum 打包成一个硬件平台,即数据计算设备 (DCA)。尽管 Greenplum 最初是纯软件产品,客户自己提供硬件平台,但 DCA 还是成为最受欢迎的平台。

  2012 年,EMC 收购了知名的 Pivotal Labs,这家公司从事结合结对编程、敏捷方法的应用程序开发,并使客户参与开发过程。事实证明,这不仅对 Greenplum 未来的发展进程非常重要,也为 2013 年 Greenplum 从 EMC 剥离出来的产品命名。

  2015 年,Pivotal 宣布采用开源策略。Pivotal 将把大部分软件捐赠给了 Apache 基金会,这些软件遵循 Apache 免费许可规则。不过,它保留了该软件的订阅式企业版本,并继续销售和支持该版本。

  Greenplum 管理层在 2015 年之前就考虑过开源战略,但认为行业尚未做好准备。直到 2015 年,许多客户要求开源。此外,Pivotal 认为开源也能吸引开发人才,通过社区参与加快 Greenplum 功能添加、最终将 Greenplum 合并到当前 PostgreSQL 版本的能力更强。

  作为开源计划的一部分,Pivotal 成立了两个小组:第一个小组负责处理用户有关 Greenplum 的问题,Pivotal 数据人员负责该小组并及时提供答案;第二个小组是 Greenplum 开发社区的对话工具。

  而之后,Pivotal 在 2020 年又被 VMWare 收购回去。被收购前,Pivotal 已于 18 年在纽交所上市,但市场表现一直不如人意,还因在财报没有提及公司 PaaS 技术与 Kubernetes 不兼容问题而被股东提起诉讼。

  另外,VMware 还试着放入 AI 元素。官方称这是一个“统一分析和人工智能”平台,支持向量数据并行处理,号称“可与最新大语言模型方法(LLM)集成”、“能够可帮助企业充分利用其数据资源”。

  同样在去年,博通以 610 亿美元的高价成功完成对 VMware 的收购,此外博通还要承担 VMware 的 80 亿美元的净债务。也就是说,现在 Pivotal Greenplum 属于博通资产。

  因此,外界纷纷猜测此次 Greenplum 突然归档源代码仓库是受此影响。毕竟博通在开源社区的声誉并不好,甚至有网友认为其在软件方面还不如甲骨文。


ca88登录页面 上一篇:2026年底前江苏基本实现房屋市政工程重大事故隐患 下一篇:达梦数据开启申购 产品市占率位居中国数据库管理系统