Wer heute noch Event-Logs analysiert, um die operativen Abläufe eines Unternehmens zu verstehen, blickt durch ein Schlüsselloch auf ein hochkomplexes Orchester. Die Realität in deutschen Mittelstandsunternehmen findet längst nicht mehr ausschließlich in den sauberen Datenbanktabellen von ERP-Systemen statt. Sie existiert in den Zwischenräumen: in hastig kopierten Excel-Zellen, in unzähligen Browser-Tabs, in Slack-Nachrichten und in lokaler Shadow-IT. Klassisches Process Mining scheitert genau an dieser Fragmentierung, weil es nur das misst, was explizit protokolliert wird.
Mit dem Rollout der neuen Generation lokaler Vision-Modelle im Juni 2026 erleben wir einen Paradigmenwechsel in der Enterprise-Automatisierung. Autonomous Process Discovery (APD) ersetzt die monatelange, beraterintensive Prozessaufnahme durch kontinuierliche, visuelle Inferenz direkt am Endgerät. Anstatt auf unvollständige Log-Dateien zu vertrauen, analysieren multimodale Edge-Modelle den tatsächlichen Bildschirm-Output in Echtzeit, verstehen die semantische Absicht hinter jedem Klick und kompilieren den passenden Automatisierungs-Agenten vollautomatisch.
Der blinde Fleck der System-Logs
Die Architektur traditioneller Process-Mining-Tools basierte auf einer fehlerhaften Grundannahme: Dass der dokumentierte Prozesspfad (der "Happy Path") mit der operativen Realität übereinstimmt. Wenn ein Sachbearbeiter jedoch Daten aus einem Legacy-System exportiert, sie in einem lokalen Python-Skript bereinigt und dann manuell in ein Web-Portal einfügt, sieht das Log-System lediglich den initialen Export und den finalen Import. Die kritische Transformationslogik dazwischen bleibt unsichtbar.
Aktuelle Telemetriedaten zeigen, dass bis zu 68 Prozent der wertschöpfenden Datenmanipulationen in B2B-Unternehmen außerhalb der geloggten Kernsysteme stattfinden. Eine Automatisierungsstrategie, die diese "Dark Processes" ignoriert, skaliert lediglich Ineffizienzen.
Hier setzt APD an. Durch den Einsatz von hochoptimierten Small Language Models (SLMs) wie Llama-5-Vision-Edge, die mit weniger als 3 Gigabyte VRAM lokal auf handelsüblichen Firmen-Laptops laufen, wird der Bildschirm selbst zur ultimativen Datenquelle. Das Modell verarbeitet den Video-Stream mit 30 Frames pro Sekunde, ohne dass auch nur ein einziges Pixel das lokale Gerät verlässt.
Pixel-Level Semantic Routing in der Praxis
Die technische Brillanz von Autonomous Process Discovery liegt nicht in der reinen Bilderkennung, sondern im semantischen Verständnis der UI-Elemente über Applikationsgrenzen hinweg. Das System nutzt eine Architektur, die wir als Pixel-Level Semantic Routing bezeichnen:
- ›Local Differential Privacy: Alle visuellen Daten werden on-device in Vektor-Repräsentationen umgewandelt. Personenbezogene Daten werden durch Zero-Shot-Anonymisierung maskiert, bevor die Prozesslogik extrahiert wird.
- ›Cross-Application Clustering: Das Modell erkennt, dass ein Wert in Zelle C4 einer Tabelle semantisch identisch mit dem Eingabefeld "Kunden-ID" in einer SaaS-Anwendung ist, selbst wenn die Bezeichnungen abweichen.
- ›Zero-Shot Agent Compilation: Sobald ein wiederkehrendes Muster mit hoher Konfidenz identifiziert ist, übergibt das Edge-Modell den abstrakten Prozessgraphen an ein zentrales Reasoning-Modell (wie GPT-6-Architect), welches den ausführbaren Python-Code für einen autonomen Agenten generiert.
Wirtschaftliche Implikationen für den Mittelstand
Für CTOs und CDOs ändert sich die ROI-Gleichung der Prozessautomatisierung fundamental. Bisher verschlang die reine Identifikation und Dokumentation von Prozessen oft 60 bis 70 Prozent des Budgets eines Automatisierungsprojekts. Externe Consultants verbrachten Wochen mit Interviews und Process-Mapping-Workshops, nur um am Ende Workflows zu dokumentieren, die bereits veraltet waren, bevor die erste Zeile Code geschrieben wurde.
Mit APD schrumpft die Time-to-Value auf wenige Tage. Die Edge-Modelle laufen passiv im Hintergrund, aggregieren die tatsächlichen Arbeitsabläufe einer gesamten Abteilung und präsentieren dem Engineering-Team fertige, verifizierte Agenten-Architekturen zur Freigabe. Dies eliminiert nicht nur die Kosten für die Prozessanalyse, sondern deckt auch jene ineffizienten Workarounds auf, die Mitarbeiter in Interviews aus Scham oder Gewohnheit niemals erwähnen würden.
Wir automatisieren nicht mehr, was in veralteten Handbüchern dokumentiert ist. Wir automatisieren, was im Unternehmen tatsächlich passiert.Key Takeaway
Das Ende des Automatisierungs-Backlogs
Der Sprung von log-basiertem Process Mining zu visueller, agentischer Prozessentdeckung markiert das Ende des klassischen Automatisierungs-Backlogs. Wenn die Identifikation, Analyse und Synthese von Workflows durch KI-Modelle am Edge übernommen wird, verschiebt sich die Rolle der IT-Abteilung. Sie wird vom Flaschenhals der Implementierung zum Orchestrator einer sich selbst optimierenden Unternehmensarchitektur. Unternehmen, die diesen Shift im Sommer 2026 ignorieren, werden feststellen, dass ihre Wettbewerber nicht nur schneller arbeiten – sie arbeiten in einer völlig anderen technologischen Dimension.