Présentation
Un cabinet de courtage en assurance d'une dizaine de collaborateurs traite quotidiennement plusieurs dizaines de bons d'adhésion. Ces documents, point de départ de toute souscription, arrivent sous des formes très diverses : formulaires papier remplis à la main par les clients, scans de qualité variable envoyés par email, photos prises depuis un smartphone, parfois même des documents partiellement raturés ou annotés.
Chaque bon d'adhésion contient des informations critiques : état civil, coordonnées, situation professionnelle, antécédents, garanties souhaitées, bénéficiaires désignés. Ces données doivent ensuite être ressaisies dans les systèmes du cabinet, puis reformatées pour générer les documents d'adhésion conformes aux exigences spécifiques de chaque compagnie d'assurance partenaire — et elles sont nombreuses, chacune avec ses propres gabarits, ses champs obligatoires, ses règles de validation.
Ce processus, absolument central dans l'activité d'un courtier, représentait une charge de travail considérable. Une collaboratrice y consacrait une part majoritaire de son temps : lecture attentive des documents manuscrits, interprétation des écritures parfois difficiles à déchiffrer, ressaisie dans les différents systèmes, vérification des cohérences, génération des documents finaux, contrôle qualité avant envoi aux compagnies.
Au-delà du temps passé, ce travail répétitif générait une fatigue cognitive importante et un risque d'erreur non négligeable — erreurs qui pouvaient entraîner des rejets de dossiers par les compagnies, des délais supplémentaires, et in fine une dégradation de l'expérience client.
L'enjeu de cette mission était clair : transformer cette tâche administrative chronophage en un flux largement automatisé, tout en maintenant — voire en améliorant — le niveau de fiabilité et de conformité des dossiers produits.
Problématique
Comment automatiser le traitement de documents manuscrits hétérogènes tout en garantissant un niveau de fiabilité compatible avec les exigences réglementaires du secteur de l'assurance ?
Le cabinet faisait face à un ensemble de défis techniques et organisationnels imbriqués.
Ce premier obstacle constituait un défi majeur. Contrairement à des formulaires numériques structurés, les bons d'adhésion manuscrits présentent une diversité considérable : écritures plus ou moins lisibles, styles calligraphiques variés, ratures, annotations marginales, champs laissés vides ou remplis de manière non standard. Certains clients écrivent en lettres capitales, d'autres en cursive ; certains utilisent des abréviations, d'autres des formulations complètes. Cette hétérogénéité rend l'automatisation particulièrement complexe.
Les documents arrivent parfois sous forme de scans haute résolution réalisés avec un scanner professionnel, parfois sous forme de photos prises à la hâte avec un smartphone dans des conditions d'éclairage médiocres — images floues, perspectives déformées, ombres portées, arrière-plans parasites. Le système devait être capable de traiter l'ensemble de ce spectre de qualité.
Chaque compagnie d'assurance impose ses propres exigences : formats de documents spécifiques, champs obligatoires différents, règles de validation particulières, nomenclatures propres. Le cabinet travaille avec plusieurs assureurs partenaires, ce qui implique de maîtriser autant de gabarits et de logiques métier. Une simple erreur de format peut entraîner le rejet du dossier.
Dans le secteur de l'assurance, les erreurs de saisie peuvent avoir des conséquences importantes : un bénéficiaire mal orthographié, une date de naissance erronée, une garantie mal cochée peuvent invalider un contrat ou créer des litiges lors d'un sinistre. Le système automatisé devait donc non seulement être performant, mais aussi intégrer des mécanismes de contrôle et de validation robustes.
Les équipes avaient leurs habitudes, leurs outils, leurs workflows établis. Toute solution devait s'insérer harmonieusement dans cet écosystème, sans imposer une rupture brutale ni nécessiter une formation lourde.
Solution
Nous avons conçu et déployé un agent IA complet, capable de traiter la chaîne de bout en bout : de la réception d'un bon d'adhésion manuscrit jusqu'à la génération de documents conformes prêts à être transmis aux compagnies.
Le système s'articule autour de plusieurs modules interconnectés, chacun spécialisé dans une étape du traitement.
Module de prétraitement d'image : Avant toute tentative de lecture, les documents entrants passent par une phase de normalisation. Ce module redresse les images inclinées ou déformées (correction de perspective), améliore le contraste pour faire ressortir l'écriture, supprime le bruit de fond, et découpe le document en zones d'intérêt correspondant aux différents champs du formulaire. Cette étape est cruciale pour maximiser les performances des modules suivants.
Module OCR spécialisé manuscrit : La reconnaissance optique de caractères sur du texte manuscrit est notoirement plus complexe que sur du texte imprimé. Nous avons déployé des modèles de deep learning spécifiquement entraînés pour l'écriture manuscrite française, capables de gérer les variations calligraphiques, les ligatures, et les styles d'écriture courants. Le système génère non pas une seule transcription, mais plusieurs hypothèses avec des scores de confiance associés.
Module d'interprétation contextuelle : C'est ici qu'intervient l'intelligence artificielle générative. Un grand modèle de langage (LLM) analyse les transcriptions brutes en tenant compte du contexte métier. Il sait qu'un champ "profession" attend un intitulé de métier, qu'un champ "date" attend un format spécifique, qu'un numéro de sécurité sociale suit une structure précise. Cette compréhension contextuelle permet de corriger les erreurs de transcription, de lever les ambiguïtés, de compléter les abréviations. Le modèle est également capable de signaler les incohérences (par exemple, une date de naissance incompatible avec une profession déclarée) ou les informations manquantes.
Module de validation et contrôle qualité : Chaque extraction est soumise à une batterie de contrôles automatiques : validation des formats (dates, numéros de téléphone, codes postaux), vérification des cohérences internes, confrontation avec des référentiels externes (base des communes, nomenclatures métier). Les champs présentant un score de confiance insuffisant ou ayant échoué à une validation sont flaggés pour révision humaine.
Module de génération documentaire : Une fois les données validées, le système génère automatiquement les documents d'adhésion dans les formats requis par chaque compagnie. Chaque assureur partenaire dispose de son propre template paramétré, avec ses règles de mapping (quel champ source alimente quel champ cible), ses transformations de données (formats de date, conventions de nommage), et ses règles de validation spécifiques.
La méthodologie a été résolument itérative et pragmatique, conformément à notre conviction que le conseil se mesure à sa capacité à produire et itérer concrètement.
Phase 1 — Diagnostic et cadrage (2 semaines) : Nous avons commencé par une immersion dans les pratiques réelles du cabinet. Observation des collaborateurs en situation, analyse d'un échantillon représentatif de bons d'adhésion (plusieurs centaines de documents), cartographie des flux documentaires existants, inventaire des gabarits de chaque compagnie partenaire. Cette phase a permis de qualifier précisément la variabilité des documents sources et de définir les critères de succès du projet.
Phase 2 — Proof of Concept ciblé (3 semaines) : Plutôt que de viser immédiatement une solution exhaustive, nous avons développé un premier prototype sur un périmètre restreint : un seul type de formulaire, une seule compagnie cible. Ce POC a permis de valider la faisabilité technique, d'identifier les cas limites, et de mesurer les performances réelles sur des données de production. Le taux de reconnaissance correct sur ce périmètre initial a atteint 87% sans intervention humaine, et 99,5% après révision des cas flaggés.
Phase 3 — Industrialisation progressive (6 semaines) : Fort des apprentissages du POC, nous avons étendu progressivement le périmètre : ajout de nouveaux types de formulaires, intégration des templates des autres compagnies partenaires, enrichissement des règles de validation. Chaque extension a fait l'objet de tests sur des données réelles avant mise en production.
Phase 4 — Intégration et formation (2 semaines) : La solution a été intégrée dans l'environnement de travail quotidien des équipes. Une interface simple permet aux collaborateurs de déposer les documents, de visualiser les extractions, de corriger les cas nécessitant une intervention, et de déclencher la génération des documents finaux. Une formation pratique a accompagné le déploiement.
Un principe fondamental a guidé toute la conception : l'IA assiste, l'humain décide. Le système est conçu pour maximiser l'automatisation sur les cas simples et bien reconnus, tout en sollicitant systématiquement la validation humaine sur les cas ambigus ou à risque.
Concrètement, chaque extraction est présentée avec un code couleur : vert pour les champs à haute confiance validés automatiquement, orange pour les champs nécessitant une vérification rapide, rouge pour les champs problématiques exigeant une attention particulière. Le collaborateur peut ainsi concentrer son attention là où elle est réellement nécessaire, plutôt que de tout revérifier uniformément.
Ce design n'est pas qu'une question d'ergonomie — c'est un choix éthique et métier. Dans un domaine où les erreurs peuvent avoir des conséquences importantes pour les assurés, maintenir l'humain dans la boucle de décision nous semblait impératif.













