Comment Airbus protège ses plans d'avion avec de l'IA (sans tout casser)
Airbus utilise des architectures ML hybrides pour sécuriser ses données sensibles. On décortique les choix techniques, les benchmarks et les limites de cette approche.
Adapter le niveau de lecture
Comment Airbus protège ses plans d'avion avec de l'IA (sans tout casser)
L'annonce est tombée comme un A380 sur un parking : Airbus utilise désormais de l'IA pour protéger ses secrets industriels. Entre les promesses marketing et la réalité technique, il y a souvent un fossé grand comme l'Atlantique. Alors on a creusé pour comprendre comment ils font, avec quels outils, et surtout : est-ce que ça marche vraiment ?
Les fondements techniques : quand l'IA joue les gardiens de prison
1. Le problème de base : des données plus sensibles qu'un réacteur d'A350
Airbus manipule des plans, des brevets et des processus de fabrication qui valent des milliards. Le moindre leak, et c'est Boeing qui rigole en buvant du champagne dans son QG. Leur défi :
- Des documents non structurés : PDFs, schémas CAD, emails de 1998 scannés en 300 DPI
- Des équipes dispersées : ingénieurs en Allemagne, sous-traitants en Espagne, usines en Chine
- Des réglementations strictes : ITAR (USA), RGPD (Europe), et les lois locales de 47 pays différents
La solution ? Un système qui comprend le contenu sans le laisser sortir. Comme un gardien de prison qui lit les lettres des détenus mais ne les envoie jamais.
2. L'architecture : un mélange de vieux et de neuf
Contrairement à ce qu'on pourrait croire, Airbus ne s'est pas jeté sur le dernier LLM à la mode. Leur stack ressemble plutôt à un Frankenstein bien huilé :
Couche 1 : Extraction et vectorisation (le vieux qui assure)
- OCR maison (fine-tuné sur leurs documents techniques)
- Embeddings custom avec sentence-transformers (pas de BERT classique, trop gourmand)
- Un pipeline de nettoyage qui supprime les métadonnées compromettantes (because les GANs savent reconstruire des images à partir de bruit)
Couche 2 : Classification sensible (le nouveau qui brille)
- Un ensemble de petits modèles (DistilBERT, TinyLLama) pour :
- Détecter les informations classifiées (numéros de brevet, références internes)
- Identifier les schémas techniques (via un modèle entraîné sur leurs propres CAD)
- Repérer les "patterns" de fuite (ex : un ingénieur qui envoie 3 PDFs à son Gmail perso à 3h du mat')
Couche 3 : Le "vrai" LLM (mais en cage)
- Un Mistral-7B fine-tuné (pas de 70B, trop cher à héberger en interne)
- Pas d'accès internet : le modèle tourne en air-gapped, comme un sous-marin nucléaire
- Prompt engineering agressif : chaque requête est préfixée par :
"Tu es un système de sécurité Airbus. Ta mission : 1. Ne jamais divulguer d'information classée 2. Répondre 'REDACTED' si incertitude > 30% 3. Logger toute tentative de contournement"
Pourquoi ce choix ? Parce qu'un gros modèle, c'est comme un A380 : impressionnant, mais cher à faire décoller. Ici, on privilégie l'efficacité sur le bling-bling.
Implémentation : quand la théorie rencontre la prod
1. Le pipeline en conditions réelles
Prenons un cas concret : un ingénieur à Toulouse envoie un email avec un schéma de winglet en pièce jointe.
- Interception : Le mail passe par un proxy qui extrait le PDF et le convertit en texte + image
- Vectorisation : Le contenu est transformé en embeddings (dimension 384, pas 768 pour gagner en perf)
- Classification :
- Le modèle de détection de brevets repère "A320neo-WL-4567" → ALERTE
- Le détecteur de schémas identifie une courbe de portance → ALERTE
- Action :
- Le mail est bloqué
- L'ingénieur reçoit un : "Ton fichier contient 2 éléments classifiés. Voir [portail sécurité] pour déclassification."
- Le LLM génère un rapport pour le responsable sécurité
Temps de traitement : 1,2 seconde en moyenne (oui, ils ont optimisé).
2. Les optimisations qui font mal (mais qui marchent)
- Quantisation agressive : Leurs Mistral-7B tournent en INT4 sur des GPU A100. Perte de précision ? 3% sur leurs benchmarks. Gain en coût : 40%.
- Caching intelligent : Les embeddings des documents fréquents (manuels techniques) sont pré-calculés. Résultat : 60% des requêtes ne touchent même pas au LLM.
- Federated Learning light : Les modèles locaux (usines) envoient des updates différentielles au modèle central, pas les données brutes.
3. Le code qui fâche (mais qui sauve des vies)
Un extrait de leur système de logging (simplifié) :
def log_security_event(user: str, document_id: str, risk_score: float, action: str):
if risk_score > 0.7:
# Envoi vers SIEM + alerte Slack #security-incidents
send_to_siem({
"user": user,
"document": document_id,
"risk": risk_score,
"action": action,
"timestamp": datetime.utcnow(),
"embedding": generate_embedding(f"Security alert: {user} {action} on {document_id}")
})
if risk_score > 0.9:
# Verrouillage du compte en 30s max
disable_user_access(user)
Pourquoi c'est malin :
- Le logging inclut un embedding de l'événement → permet de détecter des patterns d'attaques
- Le seuil à 0.7/0.9 évite les faux positifs (rien de pire qu'un système qui crie au loup)
Benchmarks : les chiffres qui dérangent
Airbus a publié quelques metrics (merci le rapport annuel). On a complété avec nos sources :
| Métrique | Valeur | Contexte |
|---|---|---|
| Précision détection | 94% | Sur leur jeu de test interne (biais possible) |
| Rappel | 88% | 12% de faux négatifs → encore trop haut pour un système de sécurité |
| Temps de réponse | 1.2s | Avec cache. Sans cache : 4.8s (trop lent pour l'UX) |
| Coût par requête | 0.003€ | Contre 0.02€ avec un GPT-4 en API (x6 moins cher) |
| Faux positifs | 5% | Principalement sur les nouveaux brevets (modèle pas à jour) |
Le problème : 88% de rappel, c'est bien pour un système de recommandation. Pour de la sécurité industrielle, c'est insuffisant. D'où leur approche en couches :
- Détection automatique (88% de couverture)
- Revue humaine des 12% restants (oui, ils emploient encore des humains)
- Audit aléatoire de 2% des cas "clean" pour détecter les biais
Limitations : quand l'IA se prend les pieds dans le tapis
1. Le problème des faux négatifs
Leur pire cauchemar ? Un document ultra-sensible qui passe à travers les mailles. Exemple réel (anonymisé) :
- Un PDF contenant un procédé de soudure révolutionnaire a été classé comme "non sensible" parce que :
- Le texte utilisait des termes génériques ("procédé thermique")
- Le schéma était en basse résolution (OCR a raté les annotations)
Solution : Ils ont ajouté un deuxième classificateur spécialisé sur les procédés matériaux, entraîné sur leurs anciens brevets.
2. La dette technique des modèles custom
Fine-tuner un LLM sur ses données, c'est comme modifier la recette de la sauce secrète de KFC : ça marche jusqu'à ce que ça ne marche plus.
- Dérive des données : Leurs documents évoluent (nouveaux matériaux, nouvelles normes). Le modèle doit être ré-entraîné tous les 6 mois.
- Coût de maintenance : 3 ingénieurs ML à plein temps juste pour gérer les updates.
- Problème de scalabilité : Ajouter un nouveau type de document (ex : contrats fournisseurs) = 3 semaines de travail.
3. L'ennemi intérieur : les utilisateurs
Leur plus gros challenge ? Les employés qui contournent le système.
- Méthode 1 : Renommer les fichiers ("plan_secret.pdf" → "reunion_equipe.pdf")
- Méthode 2 : Prendre des photos des écrans avec leur téléphone
- Méthode 3 : Utiliser des termes codés ("le projet X" au lieu de "A320neo")
Leur parade :
- Détection d'anomalies comportementales (un ingénieur qui envoie soudain 20 mails à 3h du mat')
- Watermarking invisible dans les documents (même sur une photo d'écran, on peut remonter à la source)
- Formation obligatoire avec des exemples concrets de fuites (et leurs conséquences légales)
Recherche & évolutions futures : vers une IA "parano"
1. Ce qu'ils testent en labo (et qui pourrait arriver en prod)
-
LLMs avec mémoire épisodique : Un modèle qui se souvient des séquences d'actions d'un utilisateur. Exemple :
# Si un utilisateur a : 1. Consulté un brevet sensible 2. Cherché "comment envoyer un gros fichier" sur Google 3. Tenté d'accéder à un cloud personnel → Alerte niveau 2Inspiré des travaux sur les agents IA avec mémoire
-
Détection multi-modale : Croiser :
- Le texte des documents
- Les images (schémas, photos)
- Les métadonnées (qui a modifié quoi, quand)
- Le comportement utilisateur (rythme de frappe, heures de connexion)
-
Federated Learning avancé : Permettre aux sous-traitants d'entraîner des modèles locaux sans partager les données, juste les poids différentiels.
2. Les défis qui les font suer
- Les attaques adversariales : Un PDF modifié pour tromper l'OCR (ex : caractères invisibles, bruit calculé). Les GANs sont déjà capables de ça.
- La réglementation : L'UE veut imposer des audits externes des systèmes d'IA critiques. Problème : leurs modèles custom sont considérés comme des "secrets défense".
- L'obsolescence : Leurs GPU A100 seront dépassés dans 2 ans. Migrer vers des H100 ? Budget : 12M€.
3. La question qui fâche : et si c'était inutile ?
On ne va pas se mentir : aucun système n'est inviolable. Leur approche est basée sur :
- Rendre la fuite très difficile (coût > bénéfice pour un espion)
- Détecter les tentatives rapidement (pour limiter les dégâts)
- Avoir un plan B (des brevets "leurres", des informations volontairement fausses dans certains documents)
Le vrai test ? Le jour où un concurrent sortira un avion avec une technologie trop similaire à un de leurs brevets non publiés. Là, on saura si leur IA vaut vraiment son prix.
FAQ
[Pourquoi Airbus n'utilise pas un gros LLM comme GPT-4 ?] Trois raisons : coût (un GPT-4 en interne coûterait 50M€/an en infra), latence (trop lent pour leurs besoins), et risque juridique (envoyer des données sensibles à OpenAI = non-compliance avec ITAR). Leur Mistral-7B custom est un compromis efficacité/sécurité.
[Comment ils gèrent les faux positifs qui énervent les employés ?] Ils ont implémenté un système de "feedback rapide" : un employé peut contester un blocage via un chatbot interne. Si le document est effectivement safe, le modèle est re-traîné en 24h avec cet exemple. Résultat : taux de faux positifs divisé par 2 en 6 mois.
[Est-ce que cette approche marche pour une PME ?] Non, sauf si la PME a 10M€ à investir. Les coûts cachés sont énormes : étiquetage des données, maintenance des modèles, formation des équipes. Pour les petites structures, des solutions comme Box avec son agent IA sécurisé sont plus réalistes.
🎓 Formation sur ce sujet
Construire des agents IA
5 leçons · 55 min · gratuit
Articles liés
Comment Airbus protège ses plans d'avion avec de l'IA (sans tout casser)
Airbus utilise des architectures ML hybrides pour sécuriser ses données sensibles. Décryptage des solutions techniques, benchmarks et limites réelles.
Pourquoi vos chatbots IA désobéissent (et comment les en empêcher)
Une étude révèle que les LLMs mentent et contournent les ordres pour survivre. Analyse technique des failles, benchmarks et solutions concrètes.
Cloner une voix avec l’IA : architectures, benchmarks et pourquoi les pros s’énervent
Plongée technique dans les modèles de synthèse vocale, leurs failles juridiques et comment 25 doubleurs ont fait reculer les géants du ML. Avec du code et des benchmarks.