Johnny Chivers, EMEA AWS Technical Director
Aidan Caffrey, Distinguished Architect and UK FS Data and AI Engineering Lead
Chez PwC, nous sommes pionniers dans l'intégration de l'IA agentique dans les services financiers, aidant les entreprises à prendre des décisions plus intelligentes et adaptatives.
Pour relever ces défis, nous proposons un processus axé sur les évènements regroupant :
Au lieu d’appels directs entre les services IA, chaque événement est publié sur Kafka, permettant aux agents et services de fonctionner de manière asynchrone. Avantages clés :
Grâce à ce couplage lâche, les entreprises peuvent adapter individuellement les tâches IA, la logique métier ou les étapes de conformité sans impacter l’ensemble du système.
Vous trouverez ci-dessous un tableau récapitulatif des « décisions clés » qui associe chaque choix technologique à un cas d’utilisation typique, ainsi que des considérations sur le coût et la complexité :
Technologie | Rôle | Cas d’utilisation | Complexité et coût |
Apache Kafka | Bus d’événements central, journal pour la relecture | Quasiment tous les flux de travail IA axés sur les évènements | Complexité moyenne, mais essentiel pour la résilience |
Kafka Streams | Transformation/agrégation des données en temps réel | Pré-traitement des données avant l’inférence IA | Complexité de développement plus élevée ; peut réduire la charge de l’IA |
Camunda 8 (Zeebe) | Orchestration des processus BPMN | Flux de travail de longue durée avec logique de branchement | Surcharge modérée ; simplifie la logique métier |
Apache Flink | Traitement d’événements à faible latence | Données à grande vitesse (p. ex. alertes à la fraude) | Surcharge opérationnelle plus élevée, ultra-rapide |
Redis + Redis Streams | Mise en cache en mémoire et gestion des sessions | État de session pour l’IA conversationnelle, mise en cache des identifiants | Complexité moyenne, rapide et rentable |
ClickHouse/PostgreSQL | Vues matérialisées et stockage des audits | Conformité et analyses historiques | Bonne évolutivité, nécessite des frais généraux de gestion de la base de données |
Ray Serve | Inférence distribuée pour les agents IA | Traitement de milliers de requêtes IA simultanées | Surcharge opérationnelle plus avancée, mais bénéfices à grande échelle |
Hugging Face Endpoints | Déploiement rapide de modèles (basé sur API) | Itération rapide sur les modèles d’apprentissage automatique | Minimise la configuration de l’infrastructure, mais peut être plus coûteux |
ONNX Runtime | Optimisation des modèles pour une utilisation multi-plateformes | Réduction des coûts de calcul sur CPU/GPU/TPU | Quelques surcharges de conversion de modèle, économies de coûts |
Une architecture axée sur les évènements alimentée par Kafka et l’orchestration basée sur BPMN offre un cadre évolutif et résilient pour l’IA en entreprise. En séparant la logique des processus métier des tâches IA, les organisations peuvent optimiser indépendamment chaque couche, offrant ainsi une évolutivité transparente, une tolérance aux défaillances et des pistes d’audit conformes aux exigences réglementaires. L’ajout d’outils d’observabilité robustes et une planification minutieuse autour des coûts et de la complexité garantissent que ces architectures restent durables au fil du temps.
Pour les entreprises engagées dans une IA évolutive et responsable, cette feuille de route offre un plan détaillé et complet. Elle répond aux exigences interdépendantes de performance en temps réel, de tolérance aux défaillances et de conformité réglementaire, contribuant ainsi à protéger à la fois la réputation de l’entreprise et l’expérience des clients, des régulateurs et des parties prenantes.
https://pages.pwc.ch/view-form?id=701Vl00000dxMuJIAU&embed=true&lang=fr
Partner and Forensic Services and Financial Crime Leader, Zurich, PwC Switzerland
+41 58 792 17 60