The Playbook

Helicone

Helicone ist eine US-amerikanische Open-Source-Plattform für LLM-Observability. Das Tool sitzt als Proxy oder via SDK vor OpenAI-, Anthropic-, Azure- und...

Website
helicone.ai
Aktualisiert
4.6.2026

Helicone

Helicone ist eine US-amerikanische Open-Source-Plattform für LLM-Observability. Das Tool sitzt als Proxy oder via SDK vor OpenAI-, Anthropic-, Azure- und anderen LLM-APIs und protokolliert Prompts, Responses, Latenzen, Kosten und Token-Verbrauch. Zielgruppe sind Engineering-Teams, die produktive GenAI-Features in SaaS-Anwendungen betreiben und nicht im Blindflug skalieren wollen.

Überblick

  • Name: Helicone, Inc.
  • Typ: Firma (B2B-Software, LLM-Observability / LLMOps)
  • Gründung: 2023
  • Hauptsitz: San Francisco, Kalifornien, USA
  • Mitarbeiter: kleines Team, Größenordnung <30 (Stand 2026)
  • Geschäftsmodell: Open-Core SaaS, Self-Hosting möglich
  • Website: helicone.ai

Produkte und Services

Helicone deckt den Observability- und Evaluation-Layer für Anwendungen ab, die LLM-APIs nutzen. Der Funktionsumfang gliedert sich grob in fünf Bereiche:

BereichFunktion
LoggingVollständige Erfassung von Requests/Responses inkl. Prompt, Completion, Tokens, Latenz, Kosten
Sessions & TracesMulti-Step-Tracing für Agenten und Chains (vergleichbar mit LangSmith-Traces)
Prompt ManagementVersionierung von Prompts, A/B-Tests, Templates
EvaluationsOnline- und Offline-Evals, LLM-as-Judge, Custom Scorers
GatewayOptional als Proxy mit Caching, Rate-Limiting, Retries, Fallback zwischen Providern

Die Integration funktioniert auf zwei Wegen: Entweder per Änderung der Base-URL des bestehenden OpenAI- oder Anthropic-SDKs (One-Line-Integration) oder asynchron via Async-Logger-SDK ohne Latenzpfad. Unterstützt werden OpenAI, Anthropic, Google Gemini, Mistral, Together AI, OpenRouter, Groq, Azure OpenAI und lokale Modelle via Ollama.

Der Code steht unter Apache-2.0 auf GitHub. Self-Hosting via Docker Compose oder Kubernetes ist möglich und wird aktiv beworben, was Helicone gegenüber Closed-Source-Konkurrenz wie LangSmith differenziert.

Geschichte und Entwicklung

Gegründet 2023 von Justin Torre, Cole Gottdank und Scott Nguyen. Der Pitch: Beim Bau eines eigenen GPT-Wrappers haben die Founder festgestellt, dass es kein vernünftiges Tool gibt, um Prompts, Kosten und Fehler in Produktion zu beobachten — also haben sie es selbst gebaut.

  • Winter 2023: Aufnahme in den Y-Combinator-Batch W23
  • 2023: Launch der Open-Source-Version, erste Seed-Finanzierung
  • 2024: Ausbau Prompt Management, Sessions, Evaluations
  • 2025: AI Gateway mit Provider-Routing und Caching, Erweiterung um Agent-Observability

Helicone gehört zur ersten Welle der LLMOps-Tools, die parallel zum ChatGPT-Boom entstanden sind. Anders als Langfuse (Berlin) oder LangSmith (von LangChain) hat Helicone von Anfang an auf eine SDK-freie Proxy-Integration gesetzt.

Team und Führung

  • Justin Torre — Co-Founder & CEO, vorher Engineer bei Sisu
  • Cole Gottdank — Co-Founder & CTO
  • Scott Nguyen — Co-Founder

Das Team ist klein und engineering-lastig. Wachstum erfolgt nach Community- und Bottom-Up-Logik: Developer findet das Tool, integriert es im Side-Project, bringt es ins Team.

Investoren und Eigentümer

Helicone ist VC-finanziert, kein PE-Investment. Eine Exit-Prognose ist nicht ableitbar, da kein PE-Fonds beteiligt ist und keine spezifischen Fondsnamen mit Vintage-Jahr veröffentlicht wurden.

Bekannte Kapitalgeber:

  • Y Combinator (W23-Batch, Standard-Seed-Konditionen)
  • Weitere Seed-Investoren aus dem US-Earlystage-Umfeld

Konkrete Fondsnamen mit Vintage sind nicht öffentlich kommuniziert. Damit entfällt die übliche Vintage-+8-10-Logik.

Konkurrenz

Der LLM-Observability-Markt ist 2025/2026 stark fragmentiert. Drei Lager kämpfen um dieselben Engineering-Teams:

Open-Source-Native:

  • Langfuse — Berliner Konkurrent, ebenfalls Apache-2.0, stärker im Trace-Modell
  • Arize Phoenix — Open-Source-Arm von Arize AI

Closed SaaS, LangChain-nahe:

  • LangSmith (LangChain) — tief integriert mit LangChain/LangGraph
  • LlamaTrace (LlamaIndex)

Enterprise-APM mit LLM-Modul:

  • Datadog LLM Observability
  • New Relic AI Monitoring
  • Dynatrace, Splunk Observability Cloud

Eval-Spezialisten mit Overlap:

  • Braintrust
  • Patronus AI
  • Galileo

Helicones Positionierung gegen diese Gruppen: niedrige Integrations-Hürde (Proxy statt SDK-Refactor), Open Source, Self-Hosting für regulierte Branchen, sowie Gateway-Features (Caching, Fallback), die andere Tools nicht bündeln.

Für DACH-Engineering-Teams in regulierten Sektoren (Finance, Health, Public Sector) ist Helicone wegen Self-Hosting eine Alternative zu US-SaaS-only-Anbietern — im direkten Vergleich mit dem Berliner Langfuse (Anm.: Eigene Wiki-Verlinkung erfolgt, falls Eintrag existiert) steht aber meist letzteres im engeren Auswahlkreis, weil DSGVO-Argumentation und EU-Hosting näher liegen.

Quellen