Was KI-Automation im Mittelstand wirklich kostet

Neunzig Prozent der KI-Angebote, die Mittelständler derzeit erhalten, liegen zwischen 2.500 und 8.000 Euro. Neunzig Prozent davon sind Automatisierungsworkflows in n8n oder Make, die einen API-Call an ein Sprachmodell absetzen, und das ist keine Kritik an der Technologie, sondern an der Preistransparenz. Wer als Entscheider nicht versteht, wofür er zahlt, kauft entweder zu teuer oder zu billig.

Die drei Szenarien: Was steckt hinter den Preisschildern?

KI-Projekte im Mittelstand lassen sich in drei Komplexitätsstufen einteilen, die sich nicht nur im Preis, sondern fundamental in Architektur, Risiko und Wartungsaufwand unterscheiden. Die Verwechslung dieser Stufen ist die häufigste Ursache für gescheiterte Projekte und enttäuschte Erwartungen.

Szenario 1: Kleiner Workflow umfasst regelbasierte Automatisierungen mit einem oder zwei LLM-Calls. Typische Anwendungsfälle sind automatische E-Mail-Klassifizierung, Zusammenfassung eingehender Dokumente oder einfache FAQ-Beantwortung über einen Chatbot auf der Website.

›Einmalige Entwicklungskosten: 3.000 bis 8.000 Euro (Konzeption, Implementierung in n8n/Make/Zapier, Prompting, Testing)
›Laufende API-Kosten: 50 bis 200 Euro pro Monat bei moderatem Volumen (ca. 5.000 bis 50.000 Anfragen/Monat)
›Wartung: 2 bis 4 Stunden pro Monat, meist intern handhabbar nach Einweisung
›Technologiestack: n8n, Make, Zapier mit OpenAI- oder Anthropic-API-Anbindung

Szenario 2: Mittlerer Agent bedeutet ein System, das mehrere Schritte autonom ausführt, auf externe Datenquellen zugreift (CRM, ERP, Datenbanken) und Entscheidungen trifft, die über einfache Klassifizierung hinausgehen. Hier beginnt echte Agenten-Architektur: Tool-Calling, Speicher, Fehlerbehandlung.

›Einmalige Entwicklungskosten: 15.000 bis 40.000 Euro (Architektur, Custom-Code, Systemintegration, Sicherheitskonzept, Deployment)
›Laufende Kosten: 200 bis 800 Euro pro Monat (API-Kosten plus Hosting auf AWS/Azure/GCP oder dedizierter Infrastruktur)
›Wartung: 8 bis 20 Stunden pro Monat, erfordert technisches Know-how oder Agentur-Retainer
›Technologiestack: LangChain oder LlamaIndex als Framework, Vektordatenbank (Pinecone, Weaviate oder pgvector), Custom Python/TypeScript-Backend

Szenario 3: Komplexes System umfasst Multi-Agenten-Architekturen, tiefe ERP-Integration, unternehmensweite Rollouts mit Compliance-Anforderungen, Fine-Tuning oder RAG-Systeme über große proprietäre Datensätze. Diese Projekte sind Softwareentwicklungsprojekte, keine Automatisierungsaufgaben.

›Einmalige Entwicklungskosten: 60.000 bis 200.000 Euro und mehr (Architektur, mehrere Entwickler, Datenpipelines, Security-Audit, Change Management)
›Laufende Kosten: 1.000 bis 5.000 Euro pro Monat (Infrastruktur, Monitoring, API-Kosten bei hohem Volumen, Sicherheitsupdates)
›Wartung: Dediziertes Team oder langfristiger Agentur-Vertrag, mindestens 0,5 FTE intern für Koordination

3–8k€Kleiner Workflow, einmalig

15–40k€Mittlerer Agent, einmalig

60–200k€Komplexes System, einmalig

API-Kosten: Die unterschätzte Variable

Token-Kosten sind der am häufigsten unterschätzte Kostenfaktor in KI-Projekten. Viele Auftraggeber sehen die Entwicklungsrechnung und vergessen, dass jeder API-Call Geld kostet, und zwar dauerhaft, skalierend mit dem Nutzungsvolumen.

Die Preisunterschiede zwischen Modellen sind erheblich. Günstigere, schnellere Modelle kosten einen Bruchteil der Flaggschiff-Varianten, liefern aber bei komplexen Reasoning-Aufgaben schlechtere Ergebnisse. Die Modellwahl ist eine wirtschaftliche Entscheidung, keine rein technische. Ein System, das unnötigerweise das teuerste verfügbare Modell für einfache Klassifizierungsaufgaben einsetzt, verbrennt Geld.

Konkret: Ein Kundenservice-Agent, der täglich 500 Anfragen bearbeitet und dabei durchschnittlich 2.000 Input-Token plus 500 Output-Token pro Anfrage verbraucht, erzeugt bei einem Premium-Modell monatliche API-Kosten von 300 bis 600 Euro. Dasselbe System mit einem kleineren, aufgabenspezifisch optimierten Modell kann auf 40 bis 80 Euro sinken. Der Unterschied ist ein Faktor 7, bei identischer Ausgabequalität für einfache Anfragen.

Key Insight

Token-Kosten machen bei schlecht konzipierten Systemen nach 18 Monaten mehr aus als die ursprünglichen Entwicklungskosten. Wer beim Architektur-Design spart, zahlt es beim Betrieb zurück, mit Zinseszins.

Die fünf häufigsten Kostenfallen

Projekte scheitern selten an der Grundidee. Sie scheitern an Kostenpositionen, die im ursprünglichen Angebot nicht auftauchen, weil sie niemand explizit angesprochen hat oder weil der Anbieter sie selbst nicht einkalkuliert hat.

›Token-Explosion durch schlechtes Prompting: Lange, redundante System-Prompts, die bei jedem Call mitgesendet werden, multiplizieren die Kosten. Ein 2.000-Token-System-Prompt bei 10.000 täglichen Calls kostet allein durch den Prompt-Overhead mehrere Hundert Euro pro Monat extra.
›Modell-Switches ohne Neutest: Wenn ein Anbieter sein Modell aktualisiert oder ein günstigeres Modell eingesetzt werden soll, müssen alle Prompts neu evaluiert werden. Dieser Aufwand wird selten budgetiert, kostet aber regelmäßig 5.000 bis 15.000 Euro in Entwicklungszeit.
›Maintenance-Blindspot: Laut McKinsey State of AI 2024 unterschätzen Unternehmen den laufenden Wartungsaufwand für KI-Systeme um durchschnittlich 40 Prozent. Datenqualität degradiert, Schnittstellen ändern sich, Edge Cases häufen sich an.
›Fehlende Monitoring-Infrastruktur: Ohne Logging und Alerting weiß niemand, wenn das System beginnt, schlechte Outputs zu produzieren. Der Aufbau eines ordentlichen Observability-Stacks kostet 3.000 bis 8.000 Euro extra, wird aber oft weggespart.
›Datenschutz und Compliance nachträglich: DSGVO-konforme Datenhaltung, Verarbeitungsverzeichnisse, Auftragsverarbeitungsverträge mit API-Anbietern: Wer das nicht von Anfang an einplant, zahlt später für Nachbesserungen oder riskiert Bußgelder.

No-Code vs. Custom: Wann welcher Ansatz wirtschaftlich ist

Die Entscheidung zwischen einem No-Code-Tool wie n8n oder Make und einer Custom-Entwicklung ist keine Frage des Prestiges, sondern der Anforderungen. No-Code-Lösungen sind schneller, günstiger und für viele Anwendungsfälle vollkommen ausreichend. Wer das Gegenteil behauptet, verkauft Custom-Entwicklung.

n8n eignet sich hervorragend für lineare Workflows mit klaren Trigger-Action-Mustern: Eingehende E-Mail klassifizieren, in CRM eintragen, Antwort generieren, versenden. Dieser Workflow ist in n8n in zwei bis drei Tagen gebaut und kostet 2.000 bis 4.000 Euro in Agentur-Zeit. Dasselbe als Custom-Python-Anwendung zu bauen würde 12.000 bis 20.000 Euro kosten, ohne messbaren Mehrwert.

Custom-Entwicklung wird dann wirtschaftlich, wenn Anforderungen entstehen, die No-Code-Tools strukturell nicht abbilden können: komplexe Fehlerbehandlung mit Retry-Logik, dynamische Agenten-Orchestrierung, proprietäre Datenquellen mit nicht-standardisierten APIs, oder Skalierungsanforderungen jenseits der Limits von SaaS-Plattformen. Zalando beispielsweise betreibt seine KI-Systeme auf eigener Infrastruktur, weil die Anforderungen an Latenz, Datenschutz und Skalierung keine SaaS-Lösung erlauben.

"The total cost of ownership for AI systems is typically two to three times the initial development cost when you account for the first two years of operation."

Key Takeaway

— McKinsey Global Institute, "The State of AI", 2024 Report

Infrastruktur: Der unsichtbare Kostenblock

Viele Angebote nennen Entwicklungskosten und API-Kosten, verschweigen aber die Infrastrukturkosten. Dabei sind diese bei mittleren und komplexen Systemen erheblich. Ein produktives KI-System braucht mehr als einen API-Call.

Typische Infrastrukturkomponenten für einen mittleren Agenten umfassen: einen Applikationsserver (20 bis 80 Euro pro Monat auf AWS oder Azure), eine Vektordatenbank für RAG-Systeme wie Pinecone oder eine selbst gehostete Weaviate-Instanz (50 bis 300 Euro pro Monat je nach Datenmenge), eine relationale Datenbank für Konversationshistorie und Logging (15 bis 60 Euro pro Monat), sowie ein Monitoring-Tool. Zusammen kommen schnell 150 bis 500 Euro monatliche Infrastrukturkosten zusammen, die im Angebot oft fehlen.

Wer auf europäische Datensouveränität angewiesen ist, zahlt einen Aufschlag. Hosting in deutschen oder europäischen Rechenzentren (Hetzner, IONOS, OVH) ist günstiger als AWS Frankfurt, aber die Konfiguration und das Fehlen mancher Managed Services erhöhen den Entwicklungsaufwand. DSGVO-Compliance ist kein Kostenfaktor, der wegverhandelt werden kann, er muss eingepreist sein.

40%Unterschätzung Wartungsaufwand (McKinsey 2024)

2–3×TCO vs. Entwicklungskosten nach 2 Jahren

7×Kostendifferenz Premium- vs. Effizienzmodell bei gleicher Aufgabe

ROI-Kalkulation: Wann rechnet sich ein KI-Projekt?

Die Frage nach dem ROI ist keine philosophische, sondern eine arithmetische. Ein KI-Projekt rechnet sich, wenn die eingesparte Arbeitszeit oder der generierte Mehrwert die Gesamtkosten über einen definierten Zeitraum übersteigt. Drei Jahre sind ein realistischer Betrachtungshorizont für mittlere Systeme.

Beispielrechnung für einen Dokumentenverarbeitungs-Agenten: Entwicklungskosten 25.000 Euro, laufende Kosten 400 Euro pro Monat. Ein Mitarbeiter, der bisher 20 Stunden pro Woche mit manueller Dokumentenverarbeitung verbringt, kostet bei einem Vollkostenansatz von 60 Euro pro Stunde rund 62.400 Euro pro Jahr. Reduziert der Agent diesen Aufwand um 70 Prozent, spart das Unternehmen 43.680 Euro jährlich. Der Break-even liegt bei unter einem Jahr.

Diese Rechnung funktioniert nur, wenn der Prozess tatsächlich automatisierbar ist und die Ausgabequalität des Systems ausreicht. Laut Stanford AI Index 2024 scheitern 35 Prozent der KI-Pilotprojekte nicht an der Technologie, sondern an unklaren Erfolgskriterien und fehlender Prozessdokumentation vor Projektstart. Das ist ein vermeidbarer Kostentreiber.

Was bedeutet das für Unternehmen?

Aus dem Kostenbreakdown ergeben sich konkrete Handlungsempfehlungen für Entscheider, die KI-Projekte budgetieren und beauftragen.

›Gesamtkostenbetrachtung über 36 Monate: Jedes Angebot muss Entwicklungskosten, API-Kosten, Infrastruktur und Wartung für drei Jahre ausweisen. Wer nur Entwicklungskosten nennt, verschweigt die Hälfte der Wahrheit.
›Iterativer Aufbau statt Big Bang: Starten Sie mit einem kleinen Workflow (3.000 bis 8.000 Euro), validieren Sie den Nutzen, und skalieren Sie dann. Kein Unternehmen sollte 60.000 Euro in ein System investieren, bevor ein 5.000-Euro-Proof-of-Concept den Wert bewiesen hat.
›Modellwahl als Kostenhebel verstehen: Beauftragen Sie Ihren Dienstleister explizit damit, die günstigste Modellvariante zu evaluieren, die die Qualitätsanforderungen erfüllt. Das ist keine Sparmaßnahme, sondern gutes Engineering.
›Wartungsbudget von Anfang an einplanen: Kalkulieren Sie 15 bis 25 Prozent der Entwicklungskosten als jährliches Wartungsbudget ein. Systeme ohne Wartungsbudget sind keine Assets, sondern technische Schulden mit Ablaufdatum.
›Prozessdokumentation vor Projektstart: Dokumentieren Sie den zu automatisierenden Prozess vollständig, bevor Sie ein Angebot einholen. Jede Stunde, die ein Entwickler damit verbringt, Ihren Prozess zu verstehen, kostet 100 bis 180 Euro. Das ist Ihr Geld.

Häufig gestellte Fragen

Was macht 80 Prozent der Kosten eines KI-Projekts aus?

Bei einmaligen Kosten dominiert der Entwicklungsaufwand: Konzeption, Architektur, Integration in bestehende Systeme und Testing machen typischerweise 70 bis 80 Prozent der Projektkosten aus. Die eigentliche KI-Logik, also Prompting und Modellauswahl, ist oft der kleinste Teil. Bei laufenden Kosten hängt die Verteilung stark vom Volumen ab: Bei hohem Nutzungsvolumen dominieren API-Kosten, bei niedrigem Volumen überwiegen Infrastruktur und Wartung.

Kann ich ein KI-System iterativ aufbauen und das Budget strecken?

Ja, und es ist der empfohlene Ansatz. Ein guter Dienstleister baut Systeme so, dass sie erweiterbar sind. Starten Sie mit dem einfachsten Workflow, der echten Wert liefert, messen Sie den ROI, und entscheiden Sie dann über die nächste Ausbaustufe. Der Fehler liegt darin, von Anfang an das komplexeste System zu planen, weil die Anforderungen in der Praxis immer anders sind als auf dem Papier. Iteratives Vorgehen reduziert das Risiko von Fehlinvestitionen erheblich.

Wann lohnt sich Custom-Entwicklung gegenüber Make oder n8n?

Custom-Entwicklung lohnt sich, wenn mindestens einer dieser Faktoren zutrifft: Die Anforderungen an Fehlerbehandlung und Robustheit übersteigen, was No-Code-Tools bieten. Das Volumen ist so hoch, dass SaaS-Plattform-Kosten die Entwicklungskosten einer eigenen Lösung übersteigen würden. Datenschutzanforderungen verbieten die Nutzung von Cloud-SaaS-Diensten. Oder die Systemintegration ist so komplex, dass No-Code-Konnektoren nicht ausreichen. In allen anderen Fällen ist n8n oder Make die wirtschaftlichere Wahl.

Wie erkenne ich ein seriöses Angebot von einem überteuerten?

Ein seriöses Angebot schlüsselt Entwicklungsaufwand in Stunden auf, nennt den verwendeten Technologiestack explizit, enthält eine Schätzung der laufenden Kosten für mindestens 12 Monate, und definiert klare Abnahmekriterien. Angebote, die nur eine Gesamtsumme nennen ohne Aufschlüsselung, oder die laufende Kosten komplett ignorieren, sind entweder unerfahren oder intransparent. Beides ist ein Warnsignal.

Was kostet ChatGPT Enterprise für ein mittelständisches Unternehmen?

ChatGPT Enterprise wird nutzungsbasiert lizenziert und richtet sich nach Sitzanzahl und Volumen. Für ein Unternehmen mit 100 aktiven Nutzern sind Kosten von 3.000 bis 6.000 Euro pro Monat realistisch. Das ist ein Produktivitätstool für Wissensarbeiter, kein Ersatz für maßgeschneiderte KI-Automatisierung. Die Frage ist nicht, ob Enterprise-Lizenzen oder Custom-Entwicklung, sondern welcher Anwendungsfall welches Instrument erfordert. Beide Kategorien können parallel sinnvoll sein.

Alle Artikel