The Playbook
Produkt Aktualisiert: 4.1.2026

Lucene

Lucene: Apache Lucene ist eine leistungsstarke, quelloffene Volltextsuchmaschinen-Bibliothek, die vollständig in Java geschrieben wurde.

Lucene

Apache Lucene ist eine leistungsstarke, quelloffene Volltextsuchmaschinen-Bibliothek, die vollständig in Java geschrieben wurde. Die Software wurde ursprünglich 1999 von Doug Cutting entwickelt und im Jahr 2000 als Open Source veröffentlicht. Heute bildet Lucene das technologische Fundament zahlreicher Suchanwendungen weltweit und treibt bekannte Plattformen wie Elasticsearch, Apache Solr und OpenSearch an. Die Bibliothek wird von der Apache Software Foundation verwaltet und ist unter der kommerziell freundlichen Apache-2.0-Lizenz verfügbar.

Überblick

  • Typ: Open-Source-Suchmaschinen-Bibliothek
  • Kategorie: Volltextsuche, Indexierung, Information Retrieval
  • Programmiersprache: Java (97,8%), Python-Bindings verfügbar
  • Lizenz: Apache License 2.0
  • Erstveröffentlichung: April 2000
  • Aktuelle Version: 10.3.2 (November 2025)
  • Gründer: Doug Cutting
  • Organisation: Apache Software Foundation
  • Website: lucene.apache.org
  • Repository: github.com/apache/lucene

Produkte und Komponenten

Lucene Core

Die Kernbibliothek bietet leistungsfähige Funktionen für Indexierung und Suche:

FeatureBeschreibung
VolltextsucheSchnelle Suche über strukturierte und unstrukturierte Daten
Invertierte IndizesEffiziente Datenstruktur für schnelle Suchanfragen
AnalysatorenTokenisierung und Textverarbeitung für verschiedene Sprachen
Query-TypenPhrase Queries, Wildcard, Proximity, Range Queries u.v.m.
FacettierungFilterung und Kategorisierung von Suchergebnissen
Vektor-SucheNearest-Neighbor-Suche über hochdimensionale Vektoren
RechtschreibkorrekturAutomatische Vorschläge bei Tippfehlern
Hit HighlightingHervorhebung von Suchtreffern im Text

PyLucene

Python-Bindings für Lucene Core, die es ermöglichen, die Bibliothek in Python-Projekten zu verwenden.

Abgeleitete Projekte

Lucene bildet die technische Basis für mehrere eigenständige Suchplattformen:

  • Apache Solr – Enterprise-Suchserver mit REST-API
  • Elasticsearch – Verteilte Such- und Analytics-Engine
  • OpenSearch – Open-Source-Fork von Elasticsearch (seit 2021)
  • MongoDB Atlas Search – Cloud-native Suche auf MongoDB-Basis

Geschichte und Entwicklung

Ursprünge (1997–2000)

Doug Cutting begann 1997 während seiner Tätigkeit bei Excite mit der Arbeit an Lucene. Die Software war bereits seine fünfte Suchmaschine – zuvor hatte er zwei bei Xerox PARC, eine bei Apple und eine bei Excite entwickelt. Der Name „Lucene” stammt vom zweiten Vornamen seiner Frau, der auch der Vorname ihrer Großmutter war.

Im April 2000 veröffentlichte Cutting die erste Version von Lucene auf SourceForge unter der GPL-Lizenz.

Apache-Ära (2001–heute)

JahrMeilenstein
2001Übertragung zur Apache Software Foundation
2001Beginn der Entwicklung von Apache Nutch (Web-Crawler)
2004Inspiration durch Googles MapReduce-Paper führt zu Hadoop
2005Lucene wird eigenständiges Top-Level-Projekt bei Apache
2010Apache Solr wird Teil des Lucene-Projekts
202020-jähriges Jubiläum von Lucene
2024Veröffentlichung von Version 10.0 mit Java 21-Unterstützung
2025Version 10.3 mit 40% Performance-Verbesserung bei der Suche

Technische Meilensteine in Version 10.3

  • Lexikalische Suche: 40% schneller durch SIMD-Vektorisierung
  • Vektor-Suche: 15-20% Performance-Steigerung
  • Terms Dictionary: 30% schneller bei Primary-Key-Lookups

Team und Führung

Apache Lucene wird als gemeinschaftliches Open-Source-Projekt von einem Project Management Committee (PMC) geleitet.

Aktuelle Struktur

RolleAnzahl
PMC-Mitglieder54
Aktive Committer~115
Emeritus Committer21
Emeritus PMC-Mitglieder6

PMC Chair

Bruno Roustant ist der aktuelle Vice President Apache Lucene (Nachfolger von Michael Sokolov).

Bedeutende Mitwirkende

  • Doug Cutting – Gründer und ursprünglicher Entwickler
  • Mike McCandless – Langjähriger Core-Entwickler
  • Robert Muir – Senior PMC-Mitglied
  • Yonik Seeley – Mitgründer von Apache Solr

Investoren und Eigentümer

Apache Lucene ist ein Community-getriebenes Open-Source-Projekt ohne kommerzielle Eigentümer. Das Projekt gehört zur Apache Software Foundation (ASF), einer gemeinnützigen Organisation, die zahlreiche Open-Source-Projekte verwaltet.

Die ASF finanziert sich durch:

  • Sponsoring von Unternehmen
  • Spenden
  • Infrastruktur-Sponsoren

Kommerzielle Unterstützung und Enterprise-Features werden von Drittanbietern wie Elastic, Lucidworks und anderen angeboten.

Anwender und Verbreitung

Apache Lucene und darauf aufbauende Technologien werden von tausenden Organisationen weltweit eingesetzt:

  • Twitter – Echtzeit-Suche läuft vollständig auf Lucene
  • Apple – Interne Suchanwendungen
  • Wikipedia – Nutzt Apache Solr (Lucene-basiert)
  • Netflix – Content-Suche und Empfehlungen
  • LinkedIn – Personensuche und Jobmatching
  • IBM – Enterprise-Suchlösungen
  • AOL, Comcast, MySpace – Verschiedene Suchanwendungen

Typische Anwendungsfälle

  • E-Commerce-Produktsuche
  • Dokumentenmanagementsysteme
  • Content-Management-Systeme
  • Enterprise Search
  • Log-Analyse und Monitoring
  • Wissenschaftliche Datenbanken

Konkurrenz

Lucene-basierte Alternativen

ProduktBeschreibung
Apache SolrEnterprise-Suchserver mit umfangreichen Features
ElasticsearchVerteilte Suche mit REST-API und ELK-Stack
OpenSearchAmazon-Fork von Elasticsearch (Apache 2.0)

Andere Suchbibliotheken

ProduktSpracheBeschreibung
SphinxC++Alternative für Nicht-Java-Umgebungen
TantivyRustModerne Lucene-Alternative in Rust
XapianC++Probabilistische Suchmaschinen-Bibliothek

Cloud-Suchdienste

ProduktAnbieterBeschreibung
AlgoliaAlgoliaSaaS-Suche mit AI-Features
MeilisearchOpen SourceSchnelle, typo-tolerante Suche
TypesenseOpen SourceOpen-Source-Alternative zu Algolia

Quellen

Kommentare

Kommentare werden geladen...

Kommentar schreiben

Mit dem Absenden stimmen Sie der Veröffentlichung Ihres Namens und Kommentars zu.