EMC Greenplum
EMC Greenplum war die Big-Data-Division der EMC Corporation, die 2010 durch die Akquisition des Data-Warehouse-Spezialisten Greenplum Inc. gegründet wurde.
EMC Greenplum
EMC Greenplum war die Big-Data-Division der EMC Corporation, die 2010 durch die Akquisition des Data-Warehouse-Spezialisten Greenplum Inc. gegründet wurde. Das Unternehmen entwickelt eine Open-Source-basierte, massiv parallele Datenbank-Plattform für Business Intelligence, Data Warehousing und fortgeschrittene Analytics auf Petabyte-großen Datenmengen.
Überblick
- Typ: Big-Data-Software-Division (ehemals eigenständiges Unternehmen)
- Ursprüngliche Gründung: September 2003 (als Greenplum Inc.)
- Gründer: Scott Yara und Luke Lonergan
- EMC-Akquisition: Juli 2010
- Geschätzter Kaufpreis: ca. 300 Millionen USD
- Ehemaliger Hauptsitz: San Mateo, Kalifornien, USA
- Technologie-Basis: PostgreSQL mit Massively Parallel Processing (MPP)
- Lizenz: Apache 2.0 (2015–2024), danach Closed Source
- Aktueller Status: Teil von Broadcom/VMware Tanzu Data Suite (seit 2024 Closed Source)
Produkte und Technologie
Greenplum Database
Die Greenplum Database ist ein massiv paralleles Datenbanksystem (MPP), das auf PostgreSQL basiert und für analytische Workloads optimiert ist:
- Architektur: Master-Node, Standby-Master und Segment-Nodes
- Skalierung: Petabyte-große Datenmengen
- Einsatzbereiche: Business Intelligence, Data Warehousing, Machine Learning, AI
Greenplum Data Computing Appliance (DCA)
EMC lancierte nach der Akquisition die Greenplum DCA – ein integriertes Data-Warehouse-System als Antwort auf Oracle Exadata und IBM Netezza.
HAWQ
2013 wurde HAWQ angekündigt – eine Variante, die Apache Hadoop für die Datenspeicherung im Hadoop File System nutzt.
Geschichte und Entwicklung
| Jahr | Ereignis |
|---|---|
| 2003 | Gründung von Greenplum durch Scott Yara und Luke Lonergan |
| 2005 | Erste Veröffentlichung der Datenbank-Software (ursprünglich “Bizgres”) |
| 2006 | Partnerschaft mit Sun Microsystems; Bill Cook wird CEO |
| 2006 | Series A Finanzierung (~15 Mio. USD) |
| 2007 | Series B Finanzierung (15 Mio. USD, geführt von Sierra Ventures) |
| 2008 | Series C Finanzierung (27 Mio. USD, geführt von Meritech Capital) |
| 2010 | Akquisition durch EMC Corporation für ca. 300 Mio. USD |
| 2010 | Gründung der EMC Data Computing Division unter Bill Cook |
| 2012 | Überführung in Pivotal Software als “Pivotal Greenplum Database” |
| 2013 | HAWQ SQL-on-Hadoop Projekt angekündigt |
| 2015 | Open-Source-Veröffentlichung unter Apache 2.0 Lizenz auf GitHub |
| 2018 | Pivotal Software IPO an der NYSE (555 Mio. USD Erlös) |
| 2019 | VMware akquiriert Pivotal Software für 2,7 Mrd. USD |
| 2023 | Broadcom akquiriert VMware |
| 2024 | Greenplum wird Closed Source; GitHub-Repositories archiviert |
Führungsteam
Gründer
- Scott Yara – Co-Founder
- Luke Lonergan – Co-Founder & CTO
Management
- Bill Cook – CEO (2006–2010), später President der EMC Greenplum Division (2010–2013). Cook war zuvor 19 Jahre bei Sun Microsystems als Senior Vice President of US Sales tätig und wurde später Co-Founder und President von Pivotal Software.
Investoren und Eigentümer
Venture Capital (vor der EMC-Akquisition)
Greenplum sammelte insgesamt 61 Millionen USD an Risikokapital:
| Investor | Rolle |
|---|---|
| Meritech Capital Partners | Lead Investor Series C |
| Sierra Ventures | Lead Investor Series B |
| Sun Microsystems | Strategischer Investor |
| SAP Ventures | Strategischer Investor |
| EDF Ventures | Investor |
| Hudson Venture Partners | Investor |
| Dawntreader Ventures | Investor |
| Mission Ventures | Investor |
Unternehmensgeschichte der Eigentümerschaft
- EMC Corporation (2010–2016) – Akquisition für ca. 300 Mio. USD
- Dell Technologies (2016–2019) – Nach Fusion von Dell und EMC
- VMware/Pivotal (2012–2023) – Als Teil von Pivotal Software, später VMware Tanzu
- Broadcom (seit 2023) – Nach Akquisition von VMware
Kunden und Anwendungsfälle
Greenplum wird von datengetriebenen Unternehmen weltweit eingesetzt:
Bekannte Kunden
- NASDAQ OMX
- NYSE Euronext
- Skype
- Equifax
- T-Mobile
- Fox Interactive Media
- Walmart
- Bank of America
- American Express
Typische Anwendungsfälle
- Customer Analytics
- IoT und Netzwerkoptimierung
- Sicherheitsüberwachung
- Finanzberichterstattung
- Betrugserkennung
- Machine Learning und AI-Workloads
Wettbewerb
Greenplum konkurriert mit anderen MPP-Datenbank-Systemen und Cloud-Data-Warehouses:
| Wettbewerber | Anbieter | Besonderheit |
|---|---|---|
| Teradata | Teradata | 30+ Jahre MPP-Erfahrung |
| Netezza | IBM | FPGA-beschleunigte Appliance |
| Amazon Redshift | AWS | Cloud-native |
| Snowflake | Snowflake | Multi-Cloud Data Platform |
| BigQuery | Serverless | |
| Azure Synapse | Microsoft | Hybrid-Analytics |
| Vertica | OpenText | Spaltenorientiert |
Differenzierung
Greenplum unterschied sich durch:
- Open Source: Einziges Open-Source-MPP-Data-Warehouse (2015–2024)
- Deployment-Flexibilität: On-Premises, Private Cloud und Public Cloud
- PostgreSQL-Kompatibilität: Breites Ökosystem und Tooling
Aktueller Status
Nach der Broadcom-Übernahme von VMware wurde Greenplum im Mai 2024 wieder zu Closed Source. Die GitHub-Repositories wurden archiviert und die Community-Kommunikationskanäle eingestellt. Die Software wird nun als Teil der VMware Tanzu Data Suite vermarktet.
Als Open-Source-Nachfolger entstand das Apache Cloudberry Projekt, das in den Apache Incubator aufgenommen wurde.
Quellen
- Greenplum - Wikipedia
- EMC To Acquire Greenplum - Dell Newsroom
- EMC Acquires Greenplum - TechCrunch
- Greenplum Series C Financing - PRWeb
- Pivotal Software - Wikipedia
- Greenplum Open Sourced - ADTmag
- VMware Greenplum Alternatives - G2
- [Greenplum vs. Netezza vs. Teradata - DB-Engines](https://db-engines.com/en/system/Greenplum%3BNetezza%3BTeradata)
- Bill Cook joins Yugabyte - Business Wire
- Apache Cloudberry Incubator
Kommentare werden geladen...