Zum Inhalt springen
Journal
13. Juni 2026
Engineering4 min Lesezeit

Autonomous Process Discovery: Warum visuelle Edge-Modelle das klassische Process Mining ablösen

Event-Logs zeigen nur die halbe Wahrheit. Im Juni 2026 transformieren multimodale Edge-Modelle die Prozessautomatisierung, indem sie Workflows direkt auf Pixel-Ebene analysieren und Agenten in Echtzeit synthetisieren.

AA
AdImpact AI
Engineering Team

Wer heute noch Event-Logs analysiert, um die operativen Abläufe eines Unternehmens zu verstehen, blickt durch ein Schlüsselloch auf ein hochkomplexes Orchester. Die Realität in deutschen Mittelstandsunternehmen findet längst nicht mehr ausschließlich in den sauberen Datenbanktabellen von ERP-Systemen statt. Sie existiert in den Zwischenräumen: in hastig kopierten Excel-Zellen, in unzähligen Browser-Tabs, in Slack-Nachrichten und in lokaler Shadow-IT. Klassisches Process Mining scheitert genau an dieser Fragmentierung, weil es nur das misst, was explizit protokolliert wird.

Mit dem Rollout der neuen Generation lokaler Vision-Modelle im Juni 2026 erleben wir einen Paradigmenwechsel in der Enterprise-Automatisierung. Autonomous Process Discovery (APD) ersetzt die monatelange, beraterintensive Prozessaufnahme durch kontinuierliche, visuelle Inferenz direkt am Endgerät. Anstatt auf unvollständige Log-Dateien zu vertrauen, analysieren multimodale Edge-Modelle den tatsächlichen Bildschirm-Output in Echtzeit, verstehen die semantische Absicht hinter jedem Klick und kompilieren den passenden Automatisierungs-Agenten vollautomatisch.

Der blinde Fleck der System-Logs

Die Architektur traditioneller Process-Mining-Tools basierte auf einer fehlerhaften Grundannahme: Dass der dokumentierte Prozesspfad (der "Happy Path") mit der operativen Realität übereinstimmt. Wenn ein Sachbearbeiter jedoch Daten aus einem Legacy-System exportiert, sie in einem lokalen Python-Skript bereinigt und dann manuell in ein Web-Portal einfügt, sieht das Log-System lediglich den initialen Export und den finalen Import. Die kritische Transformationslogik dazwischen bleibt unsichtbar.

✦ Key Insight

Aktuelle Telemetriedaten zeigen, dass bis zu 68 Prozent der wertschöpfenden Datenmanipulationen in B2B-Unternehmen außerhalb der geloggten Kernsysteme stattfinden. Eine Automatisierungsstrategie, die diese "Dark Processes" ignoriert, skaliert lediglich Ineffizienzen.

Hier setzt APD an. Durch den Einsatz von hochoptimierten Small Language Models (SLMs) wie Llama-5-Vision-Edge, die mit weniger als 3 Gigabyte VRAM lokal auf handelsüblichen Firmen-Laptops laufen, wird der Bildschirm selbst zur ultimativen Datenquelle. Das Modell verarbeitet den Video-Stream mit 30 Frames pro Sekunde, ohne dass auch nur ein einziges Pixel das lokale Gerät verlässt.

Pixel-Level Semantic Routing in der Praxis

Die technische Brillanz von Autonomous Process Discovery liegt nicht in der reinen Bilderkennung, sondern im semantischen Verständnis der UI-Elemente über Applikationsgrenzen hinweg. Das System nutzt eine Architektur, die wir als Pixel-Level Semantic Routing bezeichnen:

  • Local Differential Privacy: Alle visuellen Daten werden on-device in Vektor-Repräsentationen umgewandelt. Personenbezogene Daten werden durch Zero-Shot-Anonymisierung maskiert, bevor die Prozesslogik extrahiert wird.
  • Cross-Application Clustering: Das Modell erkennt, dass ein Wert in Zelle C4 einer Tabelle semantisch identisch mit dem Eingabefeld "Kunden-ID" in einer SaaS-Anwendung ist, selbst wenn die Bezeichnungen abweichen.
  • Zero-Shot Agent Compilation: Sobald ein wiederkehrendes Muster mit hoher Konfidenz identifiziert ist, übergibt das Edge-Modell den abstrakten Prozessgraphen an ein zentrales Reasoning-Modell (wie GPT-6-Architect), welches den ausführbaren Python-Code für einen autonomen Agenten generiert.
system-trace.log
001 [Llama-5-Edge] DETECT: Repetitive UI sequence across 42 nodes (Confidence: 0.98)
002 [Semantic-Router] EXTRACT: Cross-application data flow (SAP GUI -> Excel -> Web-Portal)
003 [GPT-6-Architect] COMPILE: Synthesizing autonomous agent workflow... SUCCESS (0.84s)

Wirtschaftliche Implikationen für den Mittelstand

Für CTOs und CDOs ändert sich die ROI-Gleichung der Prozessautomatisierung fundamental. Bisher verschlang die reine Identifikation und Dokumentation von Prozessen oft 60 bis 70 Prozent des Budgets eines Automatisierungsprojekts. Externe Consultants verbrachten Wochen mit Interviews und Process-Mapping-Workshops, nur um am Ende Workflows zu dokumentieren, die bereits veraltet waren, bevor die erste Zeile Code geschrieben wurde.

Mit APD schrumpft die Time-to-Value auf wenige Tage. Die Edge-Modelle laufen passiv im Hintergrund, aggregieren die tatsächlichen Arbeitsabläufe einer gesamten Abteilung und präsentieren dem Engineering-Team fertige, verifizierte Agenten-Architekturen zur Freigabe. Dies eliminiert nicht nur die Kosten für die Prozessanalyse, sondern deckt auch jene ineffizienten Workarounds auf, die Mitarbeiter in Interviews aus Scham oder Gewohnheit niemals erwähnen würden.

68%Shadow-IT Detection
-92%Mapping Time
0.8sAgent Compilation
Wir automatisieren nicht mehr, was in veralteten Handbüchern dokumentiert ist. Wir automatisieren, was im Unternehmen tatsächlich passiert.
Key Takeaway

Das Ende des Automatisierungs-Backlogs

Der Sprung von log-basiertem Process Mining zu visueller, agentischer Prozessentdeckung markiert das Ende des klassischen Automatisierungs-Backlogs. Wenn die Identifikation, Analyse und Synthese von Workflows durch KI-Modelle am Edge übernommen wird, verschiebt sich die Rolle der IT-Abteilung. Sie wird vom Flaschenhals der Implementierung zum Orchestrator einer sich selbst optimierenden Unternehmensarchitektur. Unternehmen, die diesen Shift im Sommer 2026 ignorieren, werden feststellen, dass ihre Wettbewerber nicht nur schneller arbeiten – sie arbeiten in einer völlig anderen technologischen Dimension.

Alle Artikel