Johnny Chivers, EMEA AWS Technical Director
Aidan Caffrey, Distinguished Architect and UK FS Data and AI Engineering Lead
Bei PwC sind wir Vorreiter bei der Integration von agentischer KI in Finanzdienstleistungen und helfen Unternehmen, intelligentere und anpassungsfähigere Entscheidungen zu treffen.
Aufrechterhaltung eines kohärenten Systemzustands
Wenn sich KI-Agenten innerhalb eines Systems vermehren, wird die Verwaltung einer einzigen, zuverlässigen Datenquelle schwierig. Herkömmliche, synchrone Service-to-Service-Integrationen erhöhen oft die Latenz und Komplexität und führen zu Leistungsengpässen, die Teilausfälle oder Verlangsamungen verursachen. Für Unternehmen, die mit Finanztransaktionen oder regulierten Daten (z. B. im Gesundheitswesen) umgehen, sind eine konsistente Statusverwaltung und minimale Ausfallzeiten unverzichtbar.
Um diese Herausforderungen zu bewältigen, schlagen wir einen eventgesteuerten Prozess vor, der Folgendes miteinander verbindet:
Apache Kafka für asynchrone Messaging- und Ereignisprotokollierung.
BPMN-basierte Orchestrierung (z. B. Camunda 8 powered by Zeebe) für die Verwaltung länger andauernder Workflows und Entscheidungsbäume.
Anstelle von direkten Aufrufen zwischen KI-Diensten wird jedes Ereignis in Kafka veröffentlicht, sodass Agenten und Dienste asynchron arbeiten können. Zentrale Vorteile:
Nahtlose Skalierbarkeit
Einzelne Komponenten (z. B. Transkription oder Betrugserkennung) werden unabhängig voneinander basierend auf dem Message-Durchsatz skaliert. Wenn es zu einem plötzlichen Anstieg kommt (Spitzentag im Handel, E-Commerce-Flash-Sale), müssen nur die relevanten Komponenten skaliert werden.
Resilienz und Fehlertoleranz
Mithilfe des Ereignisprotokolls von Kafka kann das System Ereignisse nach Ausfallzeiten oder Störungen wiedergeben. Dies ist in regulierten Bereichen wie dem Finanz- und Gesundheitswesen, in denen Datenverluste keine Option sind, von entscheidender Bedeutung.
Klare Trennung der Anliegen
Die BPMN-basierte Orchestrierung übernimmt den Geschäftsprozessablauf, während sich KI-Agenten auf Analyse und Entscheidungsfindung konzentrieren. Dieser modulare Aufbau reduziert die Komplexität und verbessert die Wartbarkeit.
Durch diese lose Kopplung können Unternehmen einzelne KI-Aufgaben, Geschäftslogik oder Compliance-Schritte anpassen, ohne das gesamte System aus dem Gleichgewicht zu bringen.
Nachfolgend finden Sie eine zusammengefasste Tabelle mit den «wichtigsten Entscheidungen», in der jede technologische Entscheidung mit einem typischen Anwendungsfall sowie Überlegungen zu Kosten und Komplexität abgeglichen wird:
Technologie | Rolle | Anwendungsfall | Komplexität und Kosten |
Apache Kafka | Core Event Bus, Log für Wiedergabe | Fast alle ereignisgesteuerten KI-Workflows | Mittlere Komplexität, aber entscheidend für die Resilienz |
Kafka Streams | Echtzeit-Datentransformation/-aggregation | Datenvorverarbeitung vor KI-Inferenz | Höhere Entwicklungskomplexität; kann KI-Last reduzieren |
Camunda 8 (Zeebe) | BPMN-Prozessorchestrierung | Lang andauernde Workflows mit Verzweigungslogik | Leicht erhöhter Aufwand; vereinfacht Geschäftslogik |
Apache Flink | Zustandsorientierte Ereignisverarbeitung mit geringer Latenz | Hochgeschwindigkeitsdaten (z. B. Betrugswarnungen) | Höherer betrieblicher Aufwand, extrem schnell |
Redis + Redis Streams | In-Memory-Caching und Session-Management | Session-Status für dialogorientierte KI, Caching von IDs | Mittlere Komplexität, schnell und kostengünstig |
ClickHouse/PostgreSQL | Materialisierte Ansichten und Auditing-Speicher | Compliance und historische Analysen | Gute Skalierbarkeit, erfordert DB-Verwaltungsaufwand |
Ray Serve | Verteilte Inferenz für KI-Agenten | Bearbeitung Tausender gleichzeitiger KI-Anfragen | Höherer Betriebsaufwand, hohe Skalierbarkeit |
Hugging Face Endpoints | Schnelle Modellbereitstellung (API-basiert) | Schnelle Iteration bei ML-Modellen | Minimiert die Einrichtung der Infrastruktur, kann aber teurer sein |
ONNX Runtime | Modelloptimierung für die Verwendung auf mehreren Plattformen | Reduzierung der Berechnungskosten auf CPU/GPU/TPU | Geringer Mehraufwand bei der Modellkonvertierung, Kosteneinsparungen |
Eine eventgesteuerte Architektur, die von Kafka und BPMN-basierter Orchestrierung gesteuert wird, bietet einen skalierbaren, belastbaren Rahmen für Unternehmens-KI. Durch die Trennung der Geschäftsprozesslogik von KI-Aufgaben können Unternehmen jede Schicht unabhängig voneinander optimieren und so nahtlose Skalierbarkeit, Fehlertoleranz und für die Compliance bereite Prüfprotokolle bereitstellen. Ergänzt durch robuste Tools für die Beobachtbarkeit und sorgfältige Planung in Bezug auf Kosten und Komplexität wird sichergestellt, dass diese Architekturen langfristig Bestand haben.
Für Unternehmen, die sich für eine skalierbare, verantwortungsvolle KI einsetzen, bietet diese Roadmap einen umfassenden Entwurf. Sie befasst sich mit den miteinander verflochtenen Anforderungen an Echtzeitleistung, Fehlertoleranz sowie Compliance und trägt dazu bei, sowohl die Reputation des Unternehmens als auch die Erfahrung von Kunden, Aufsichtsbehörden und Interessengruppen gleichermassen zu schützen.
https://pages.pwc.ch/view-form?id=701Vl00000dxMuJIAU&embed=true&lang=de
Partner and Forensic Services and Financial Crime Leader, Zurich, PwC Switzerland
+41 58 792 17 60