The Playbook
AI-Strategie

Horizontal AI Workbench — Eye of the Hurricane: Wie der DACH-Mittelstand 2026 seine eigene Softwarekategorie definiert

Von Jochen Maurer

HAW Horizontal AI Workbench AI Workbench Enterprise AI DACH Langdock meinGPT Multi-LLM MCP SaaSpocalypse

Horizontal AI Workbench — Eye of the Hurricane

Im Mai 2026 postet eine IT-Verantwortliche auf LinkedIn die Frage, wie der deutsche Mittelstand sie 2026 stellt: “Wir strukturieren unseren KI-Stack neu. Weg von Insellösungen, hin zu einer zentralen Plattform.” Dann eine Liste von acht Anforderungen — Multi-LLM, MCP, Agenten, Workflows, Entra ID, EU-Hosting, Enterprise-Reife, ein stabiler Anbieter. In den Kommentaren stehen elf Anbieter, die vor zwei Jahren keiner kannte: Langdock, meinGPT, innoGPT, Neuland, Vicy, TextCortex, Operaide, HiDesk, Blockbrain, AIOS, LibreChat.

Genau das ist die Geschichte. Während die Börse mit der SaaSpocalypse-These ringt — TCI verkauft Microsoft-Aktien, Salesforce fällt 26 Prozent, Agentforce kannibalisiert die eigenen Seats — entsteht in der Mitte des Sturms eine neue Softwarekategorie. Sie hat noch keinen etablierten Namen. Gartner hat sie nicht, Forrester hat sie nicht. Die iX titelt zur SaaSpocalypse im Juni-Heft 2026, ohne die Kategorie zu nennen. Aber der DACH-Mittelstand kauft sie schon.

In dieser Wiki prägen wir dafür den Begriff Horizontal AI Workbench (HAW). Analog zu Horizontal-ERP (branchenneutral, für alle Unternehmensbereiche) gegenüber vertikalen Branchen-ERPs (Fashion, Bau, Healthcare) bezeichnet HAW die anwendungsübergreifende, modellagnostische KI-Plattform für die gesamte Belegschaft — abgegrenzt von Voice-AI-Plattformen wie Cognigy und Parloa (Contact Center), von AI-Infrastruktur wie deepset und Jina AI (RAG-Bausteine) und von vertikalen Domain-Workbenches wie Harvey (Legal) oder Hebbia (Finance).

Was eine HAW wirklich ist

Eine Horizontal AI Workbench ist keine bessere ChatGPT-Oberfläche. Sie ist nicht Microsoft 365 Copilot. Sie ist eine Plattform, die Multi-LLM-Routing, Tool-Anbindung über MCP, Agenten-Bau, Workflows und Identity-Integration in einem Produkt bündelt — und das in einer Form, die ein Marketing-Mitarbeiter ohne IT-Skills bedienen kann.

Drei Eigenschaften definieren die Kategorie:

  1. Modellagnostisch. Sie schaltet zwischen GPT, Claude, Gemini, Mistral, Llama und im Idealfall eigenen Modellen um. Vendor-Lock-in auf einen Anbieter ist Anti-Feature.
  2. MCP-tauglich. Sie spricht mit dem Atlassian-Stack, mit Microsoft 365, mit GitHub und mit dem ERP — nicht per Custom-Code, sondern über das Model Context Protocol, das Anthropic 2024 als Quasi-Standard etabliert hat.
  3. Compliance-first. EU-Hosting oder Self-Hosting in der eigenen Cloud-Tenant. DSGVO als Default, nicht als Add-on. Entra-ID-Integration als Hard Requirement, weil der DACH-Konzern keine zweite Identity-Quelle aufbauen wird.

Wer diese drei Eigenschaften nicht erfüllt, kann seine “AI-Plattform” für 50 Euro pro Sitz verkaufen — wird aber im DAX-Konzern nicht in den Pilot kommen.

Warum Microsoft das nicht löst

Die Antwort der Hyperscaler heißt Copilot. Microsoft 365 Copilot ist die elegant integrierte KI-Schicht über Word, Excel, Outlook und Teams — und für reine Microsoft-Stacks ist sie unschlagbar. Aber Copilot ist nicht Multi-LLM. Copilot ist GPT, in einem Microsoft-Wrapper.

Wer 2026 eine HAW sucht, in der heute Claude die Analyse macht, morgen Mistral den deutschen Marketing-Text schreibt und übermorgen ein selbst gehostetes Llama die personenbezogenen Daten verarbeitet — der bekommt das bei Copilot nicht. Bei Amazon Q auch nicht. Bei Google Gemini for Workspace auch nicht.

Das ist die Lücke, in der die DACH-HAW-Plattformen sitzen. Sie sitzen nicht im Schatten von Microsoft. Sie sitzen im Auge des Hurrikans, das Microsoft selbst entfacht hat, als der Konzern ankündigte, alle 365-Anwendungen würden Copilot-zentrisch werden.

Was eine HAW nicht ist

Ein wiederkehrendes Missverständnis im DACH-Markt 2026 ist die Vermischung von HAW mit angrenzenden Kategorien. Drei Beispiele:

Voice-AI-Plattformen wie Cognigy (Düsseldorf, 2025 von NICE übernommen) und Parloa (Berlin, Bewertung 3 Mrd. USD nach Series D 1/2026, SAP als strategischer Investor) sind keine HAW. Sie bedienen den Contact-Center-Markt — Telefonie, Voice-First-Bots, Agent-Assist im Service. Käufer ist die Customer-Service-Leitung, nicht der CIO. Wer eine HAW evaluiert und Cognigy auf die Shortlist setzt, hat den Markt nicht verstanden.

AI-Infrastruktur-Plattformen wie deepset (Berlin, Maker des Haystack-OSS-Frameworks, Kunden Airbus und Bosch) und Jina AI (Berlin, Embeddings und Reranker, MCP-nativ) sind die Bausteine, mit denen man eine HAW oder andere KI-Anwendungen baut. Sie konkurrieren nicht mit Langdock oder meinGPT. Sie sind häufig deren Lieferanten.

Foundation-Model-Anbieter wie OpenAI, Anthropic, Mistral oder Aleph Alpha verkaufen Modelle und Chat-Frontends, keine Plattformen. Aleph Alpha hat 2024 mit der Pharia-Linie versucht, in die HAW-Kategorie zu wechseln, ist dort aber kein dominanter Player geworden. Wer eine HAW sucht, kauft sie nicht beim Modellhersteller.

Diese drei Abgrenzungen sind keine Pedanterie. Sie entscheiden, ob ein Beauty Contest funktioniert oder im Apples-und-Birnen-Vergleich versickert.

Die zehn HAW-Anbieter

Es sind ungefähr zehn relevante HAW-Anbieter im DACH-Raum, je nachdem wie streng man zählt. Vier davon sind ernsthaft erwähnenswert:

Langdock ist der bislang sichtbarste. Berliner Sitz, Multi-LLM, EU-Hosting, On-Prem-Option, Workflows, Agenten. Die Kundenliste liest sich wie der DAX-Anhang: Merck (mit 33.000 monatlich aktiven Nutzern — das ist kein Pilot, das ist Konzern-Roll-out), BASF, Würth, Eppendorf, Der Spiegel. Wer in 2026 einen Beauty Contest aufmacht, hat Langdock auf der Liste.

meinGPT aus München (SelectCode GmbH) verkauft das transparenteste Multi-LLM-Paket: sieben Modelle ab Werk, explizit MCP-Server-Anbindung, ISO 27001. Pilot-Pakete bei 10.000 bis 20.000 Euro für 90 Tage. Das ist Mid-Market-Pricing, kein Enterprise. Damit ist meinGPT die ehrlichste Antwort auf die Frage “Was kostet das?” — und das macht sie für CFOs interessant, die nicht in einer dreimonatigen Verhandlung über Custom-Verträge stecken wollen.

innoGPT aus Vechta (Inno KI GmbH) hat im Stille-Modus über tausend Geschäftskunden aufgebaut, darunter PwC und GC Gruppe. Dreißig Modelle ab Werk, dreitausend Drittsystem-Integrationen, SSO/SAML. Schwächer als Langdock und Operaide beim Self-Hosting, dafür mit der breitesten Integrations-Front. Ein Anbieter, der “wir sind die einfachste Plattform für den ungeduldigen Mittelständler” verkauft.

Operaide ist der Außenseiter, der das Microsoft-Spiel mitspielt. Die objective partner AG aus Deutschland positioniert sich mit einer nativen Entra-ID-Integration und einer Beratungshaus-Mutter im Rücken. Toyota Deutschland als öffentliche Referenz. Für den Konzern, der “wir haben schon Entra, jetzt brauchen wir nur die KI-Schicht drauf” denkt, ist Operaide der präzisere Treffer als Langdock.

Die anderen — Neuland.ai mit DORA-Profil, Vicy mit Großkonzern-Multi-Agent-Pitch, TextCortex als Knowledge-Workbench, Blockbrain mit schwacher öffentlicher Kommunikation, LibreChat als Open-Source-Antwort — sind nicht weniger relevant, aber spezialisierter. Sie gewinnen nicht den breiten Mittelstands-Vergleich, sondern die jeweilige Nische.

HiDesk, AIOS und Cognigy/Parloa, die in der LinkedIn-Diskussion ebenfalls genannt wurden, gehören nach der hier vorgenommenen Kategorisierung nicht in das HAW-Segment, sondern in die Voice-AI- bzw. AI-Infrastruktur-Subkategorien (siehe Marktübersicht).

Was an dieser Kategorie neu ist

Die spannende Beobachtung 2026 ist nicht, dass es jetzt deutsche KI-Plattformen gibt. Die spannende Beobachtung ist, dass diese Kategorie ohne Foundation Models entstanden ist. Aleph Alpha hat 2023 versucht, ein deutsches OpenAI zu werden, ist gescheitert und hat sich 2024 zum Pharia-Plattform-Anbieter umgebaut. DeepL ist ein Übersetzungs-Spezialist, kein Plattform-Player.

Stattdessen entstehen zwölf Anbieter, die niemandem das Foundation Model wegnehmen wollen. Sie kaufen GPT, Claude und Gemini ein, packen ihre Plattform darum und verkaufen das Resultat als europäische Enterprise-Lösung. Das ist klüger als alles, was die deutsche AI-Politik 2021 bis 2024 versucht hat. Wer nicht das beste Modell baut, baut die beste Hülle drumherum.

Genau das ist der Grund, warum Microsoft die Kategorie nicht killen kann. Microsoft kann GPT besser integrieren als jeder andere — aber Microsoft kann nicht Multi-LLM verkaufen, ohne sich selbst zu kannibalisieren. Microsoft kann nicht EU-Hosting versprechen, ohne sich auf einen Sub-Cloud-Status reduzieren zu lassen. Genau diese Schwächen sind die Stärken der DACH-Plattformen.

Was das für PE bedeutet

Für PE-Investoren ist die Kategorie 2026 zu früh und zu spät zugleich. Zu früh, weil die Funding-Stände der DACH-Plattformen weitgehend nicht öffentlich sind und die Multiples sich nicht stabilisiert haben. Zu spät, weil die US-Wettbewerber (Glean mit 4,6 Mrd. Bewertung, Cognition mit 4 Mrd., Sierra mit 4,5 Mrd.) bereits in Late-Stage-Runden vergeben sind.

Die ehrliche Frage für einen PE-Investor: Welcher der zwölf DACH-Anbieter konsolidiert die anderen? Das passiert in den nächsten 24 Monaten. Wer Langdock 2026/2027 in einer Series-B-Runde bekommt, kauft den wahrscheinlich besten Konsolidierer. Wer auf meinGPT oder innoGPT setzt, kauft Add-ons für einen späteren Roll-up.

Wer auf alle zwölf gleichzeitig setzt — was deutsche Family Offices zu tun pflegen — kauft Hoffnung, kein Cluster.

Was das für SaaS-Anbieter bedeutet

Wer 2026 noch klassisches SaaS verkauft (CRM, ERP, HR), muss eine Antwort auf zwei Fragen haben:

Erstens: Was passiert mit unserem Pro-Seat-Pricing, wenn der Kunde 200 von 1000 Seats durch einen Agenten ersetzt? Diese Frage haben wir hier ausführlich behandelt — sie ist nicht hypothetisch, Salesforce verliert daran 26 Prozent Marktwert.

Zweitens: Wie integrieren wir uns in die AI Workbench des Kunden, ohne unser Frontend zu verlieren? Wer keine saubere MCP-Schnittstelle anbietet, wird in zwei Jahren von der Workbench-Plattform vorgelagert. Der Anwender redet dann mit Langdock, und Langdock greift in den Workflow auf das CRM zu — das CRM verliert die Hoheit über die Bedienoberfläche.

Beide Fragen lassen sich beantworten, aber nicht durch ein weiteres Quartal “AI-Strategie”. Sie verlangen Produkt-Entscheidungen jetzt.

Die unbequeme Wahrheit

Die unbequeme Wahrheit über AI Workbenches 2026 ist nicht, dass es zu viele Anbieter gibt. Es gibt genau die richtige Anzahl, damit ein Markt entstehen kann. Die unbequeme Wahrheit ist, dass kein einziger Hyperscaler diese Kategorie gewinnen kann, ohne sich selbst auf den Status einer auswechselbaren Komponente zu reduzieren. Microsoft müsste zugeben, dass GPT eines von vielen Modellen ist. Amazon müsste zugeben, dass Bedrock kein Alleinstellungsmerkmal ist. Google müsste zugeben, dass Workspace ohne Gemini-Vorsprung gegen alle deutschen Mittelstands-Frontends antritt.

Das werden sie nicht zugeben. Genau deshalb entsteht in dieser Lücke etwas Neues.

Wer 2026 noch nach dem “deutschen OpenAI” sucht, hat die letzten 18 Monate verschlafen. Die deutsche Antwort auf OpenAI heißt nicht Aleph Alpha. Sie heißt Langdock + meinGPT + innoGPT + Operaide. Eine Hülle aus vier HAW-Plattformen über vier US-Foundation-Models.

Das mag patriotisch enttäuschen. Ökonomisch ist es das Klügste, was die Branche in 15 Jahren produziert hat.


Weiterführend: