Le Labo AI
Comment Généatique déchiffre vos gribouillis avec de l'IA (et pourquoi c'est utile)

Comment Généatique déchiffre vos gribouillis avec de l'IA (et pourquoi c'est utile)

Généatique améliore son OCR manuscrit avec des modèles hybrides et sort une version Linux. On décrypte l'architecture, les cas d'usage et le ROI pour les pros.

Adapter le niveau de lecture

9 min3 niveaux disponibles

Comment Généatique déchiffre vos gribouillis avec de l'IA (et pourquoi c'est utile)

On a tous un ancêtre qui écrivait comme un médecin sous amphétamines. Généatique, spécialiste français de la généalogie assistée par IA, vient de booster son moteur d’OCR manuscrit avec une approche hybride (deep learning + règles métiers). Et cerise sur le gâteau : une version Linux pour les puristes qui refusent de toucher à Windows.

Mais derrière l’annonce marketing — "lisez enfin les actes de 1789 comme si c’était du Times New Roman" — se cache une vraie avancée technique. Spoiler : ça ne marche pas à 100%, mais c’est déjà bien mieux que vos tentatives désespérées avec Google Lens.


Contexte : pourquoi l’OCR manuscrit, c’est l’enfer

L’OCR (reconnaissance optique de caractères) classique, ça marche très bien sur du texte imprimé. Mais le manuscrit ? C’est comme demander à un chat de résoudre une équation différentielle.

  • Variabilité infinie : chaque personne a son style, sa pression de stylo, ses tics d’écriture. Un "a" peut ressembler à un "u", un "s" à un "f", et un "parrain" à "parrain"… ou à "parrain" (oui, même l’IA hésite).
  • Dégradation des documents : encre pâlie, papier jauni, taches de vin (merci, l’ancêtre bourru). Les modèles doivent gérer le bruit comme un DJ en boîte à 4h du matin.
  • Contexte historique : un "franc" en 1850 n’a pas la même orthographe qu’aujourd’hui. Les abréviations latines ("ibid.", "op. cit.") ajoutent une couche de complexité.

Jusqu’ici, les solutions étaient soit :

  1. 100% deep learning : des modèles comme Transkribus (basé sur PyTorch) qui s’entraînent sur des corpus historiques, mais peinent avec les écritures très personnelles.
  2. 100% règles : des systèmes experts qui connaissent la structure d’un acte notarié, mais échouent dès qu’un greffier s’amuse à dessiner des paraphes artistiques.

Généatique mise sur l’hybride : du deep learning pour la reconnaissance de formes + des règles métiers pour corriger les incohérences. "Ah, ce mot ressemble à 'décédé', mais dans un acte de naissance, c’est probablement 'déclaré'".


Sous le capot : comment ça marche (sans bullshit)

1. Prétraitement : nettoyer la merde avant de la lire

Avant même de reconnaître un caractère, il faut rendre le document lisible. Généatique utilise une chaîne de traitement inspirée des pipelines de computer vision :

  • Débruitage : suppression des taches, redressement des lignes courbes (merci, les registres mal scannés).
  • Binarisation : transformation en noir et blanc pour accentuer les contours. Technique classique, mais ici optimisée pour les encres anciennes (qui réfléchissent différemment la lumière).
  • Segmentation : découpage en zones (texte, signatures, paraphes). Un modèle de type Mask R-CNN (oui, le même que pour détecter les chats sur Instagram) identifie les blocs à analyser.

Petit détail qui tue : leur algorithme de binarisation est entraîné sur des scans de documents français du XVIIIᵉ au XXᵉ siècle. Pas sur des factures PDF modernes. Ça change tout.

2. Reconnaissance : quand le deep learning rencontre les règles

C’est là que ça devient intéressant. Généatique combine :

  • Un modèle Transformer (style Vision Transformer, adapté à l’OCR) pour la reconnaissance brute des caractères. Le modèle est finetuné sur leur corpus interne (des millions d’actes notariés et d’état civil).
  • Un moteur de règles qui corrige les erreurs en fonction du contexte sémantique. Exemple :
    • Si le modèle lit "le 25 brumaire an XII", le correcteur sait que c’est une date révolutionnaire et propose "brumaire" même si les lettres sont illisibles.
    • Si un prénom est reconnu comme "Jeanne" mais que le document est un acte de décès masculin, l’IA suggère une révision.

Pour les puristes : leur architecture ressemble à ce que fait Qwen d’Alibaba pour les langues asiatiques, mais appliqué à l’écriture latine ancienne.

3. Post-traitement : l’art de deviner ce que l’ancêtre voulait dire

Même avec tout ça, il reste des zones d’ombre. Généatique utilise :

  • Un modèle de langage léger (style DistilBERT) pour proposer des corrections plausibles. "Ce mot pourrait être 'cultivateur' ou 'charpentier'… vu le contexte rural, on mise sur 'cultivateur'."
  • Un système de vote : si plusieurs hypothèses sont possibles, l’outil les présente à l’utilisateur avec un score de confiance. "À 78%, c’est 'mariage'. À 12%, c’est 'mariage' mais avec une tache d’encre. À 10%, c’est 'mariage' écrit par un enfant de 5 ans."

Cas d’usage business : à quoi ça sert (outre satisfaire sa curiosité généalogique)

1. Généalogie pro : quand les archives deviennent exploitables

Les généalogistes professionnels passent 30 à 50% de leur temps à déchiffrer des actes. Avec cet outil :

  • Gain de temps : un acte qui prenait 20 minutes est analysé en 2 minutes (avec 80-90% de précision).
  • Nouveaux services : certains cabinets proposent maintenant des "audits patrimoniaux express" en croisant les données OCR avec des bases notariales.
  • Démocratisation : les petits cabinets peuvent rivaliser avec les gros, car l’outil réduit l’avantage des équipes surdimensionnées.

Exemple concret : un client de Généatique, spécialisé dans les successions complexes, a réduit ses coûts de recherche de 40% en 6 mois.

2. Archives et bibliothèques : numériser sans y passer sa vie

Les archives départementales françaises ont des kilomètres de registres non indexés. Avec cet OCR :

  • Indexation automatique : les documents deviennent recherchables par nom, date, lieu. Finis les "Je sais que mon aïeul est né à Lyon entre 1820 et 1840, mais bon courage pour le trouver".
  • Crowdsourcing assisté : des bénévoles corrigent les erreurs de l’IA, ce qui améliore le modèle en continu (boucle de feedback classique, mais efficace).

Problème : certaines archives refusent encore de confier leurs scans à des outils cloud. La version Linux de Généatique tombe à pic pour les récalcitrants.

3. Notaires et avocats : chasser les fraudes et les erreurs

Un acte mal transcrit peut coûter cher. Exemples :

  • Détection de falsifications : en comparant l’écriture d’une signature avec celle du corps du texte, l’outil peut repérer des anomalies. "Ce testament de 1902 a une signature trop 'moderne'… vérifiez."
  • Vérification de cohérence : si une date de naissance ne colle pas avec l’âge déclaré au mariage, l’IA alerte. Utile pour les successions litigieuses.

Limite : l’outil ne remplace pas un expert, mais il réduit les risques d’erreurs humaines (et les assurances adorent ça).


APIs et intégration : comment l’utiliser sans se prendre la tête

Généatique propose plusieurs niveaux d’accès :

1. API REST (le classique)

  • Endpoint : POST /v2/ocr/handwritten avec le document en base64.
  • Réponse : JSON avec le texte reconnu, les zones de confiance, et les alternatives.
  • Tarification : ~0.05€ par page (dégressif en volume).
  • Bonus : un SDK Python officiel pour les devs flemmards.

Exemple de payload :

{
  "document": "base64_encoded_image",
  "language": "fr-FR-18th",  // Oui, ils ont des codes pour les siècles.
  "output_format": "alto-xml" // Pour les puristes de l’archivistique.
}

2. Version on-premise (pour les paranoïaques)

  • Dockerisé : tourne sur un serveur local, idéal pour les archives sensibles.
  • Prérequis : GPU NVIDIA (A100 recommandé pour les gros volumes) ou une machine avec 32Go de RAM en CPU-only (mais bon, bonne chance).
  • Prix : licence à partir de 5k€/an.

Pourquoi c’est utile : certaines mairies ou notaires ne veulent pas envoyer leurs documents dans le cloud. Cette version leur permet de garder le contrôle.

3. Plugin pour les logiciels métiers

Intégration native avec :

  • Généalogie : Heredis, Ancestry (via leur marketplace).
  • Archivistique : Arkivum, Preservica.
  • Juridique : LexisNexis (en bêta).

ROI et impact sur les équipes : est-ce que ça vaut le coup ?

Le bon

  • Productivité : un généalogiste passe de 5 actes/h à 15-20 actes/h. Pour un cabinet, ça signifie embaucher 2 personnes en moins sur un projet donné.
  • Qualité : moins d’erreurs de transcription = moins de litiges en aval. Un notaire nous a confié avoir réduit ses réclamations clients de 30%.
  • Nouveaux marchés : des cabinets se lancent dans la généalogie successorale internationale (ex : retrouver des héritiers aux États-Unis via des actes français), car l’outil gère plusieurs langues.

Le moins bon

  • Courbe d’apprentissage : l’API n’est pas plug-and-play. Il faut former les équipes à :
    • Interpréter les scores de confiance ("85% = fiable, 60% = vérifiez").
    • Corriger les erreurs pour améliorer le modèle (sinon, c’est la merde en boucle).
  • Coût caché : la version cloud est abordable, mais si vous avez 50 000 pages à traiter, ça monte vite. Un client a eu une mauvaise surprise à 3k€/mois.
  • Biais culturels : le modèle est optimisé pour la France. Si vous travaillez sur des actes québécois ou belges, préparez-vous à plus d’erreurs.

Comparaison avec les alternatives

OutilPrecision manuscritCoûtOn-premiseSpécialisation historique
Généatique85-90%```math
OuiOui (FR, XVIIIᵉ-XXᵉ)
Transkribus75-85%OuiOui (multi-lingue)
Google Vision AI60-70%
| Amazon Textract     | 65-75%              |         | Non        | Non                       |

*Notre avis* : si vous travaillez sur des documents français anciens, Généatique est **le meilleur compromis**. Pour du multilingue, Transkribus reste une valeur sûre.

---
## FAQ

**[Est-ce que ça marche sur les écritures vraiment illisibles ?]**
Non, même l’IA a ses limites. Si votre ancêtre écrivait comme un médecin sous LSD, préparez-vous à corriger manuellement. L’outil donne une base, mais les cas extrêmes (encre effacée, papier brûlé) nécessitent encore un humain.

**[Puis-je l’utiliser pour numériser mes propres documents familiaux ?]**
Oui, via leur interface web (abonnements à partir de 20€/mois). Mais attention : si vos documents sont en italien ou en allemand, les résultats seront moins bons que pour le français.

**[Est-ce que l’API est compatible avec d’autres outils d’IA ?]**
Oui, la sortie est en JSON/ALTO-XML, donc vous pouvez l’intégrer à une pipeline plus large (ex : enrichissement avec un LLM comme [Claude](https://lelabo.ai/articles/claude-4-nouveau-modele-anthropic) pour extraire des entités nommées).

Articles liés