Le Labo AI
Comment Airbus protège ses plans d'avion avec de l'IA (sans tout casser)

Comment Airbus protège ses plans d'avion avec de l'IA (sans tout casser)

Airbus utilise des architectures ML hybrides pour sécuriser ses données sensibles. Décryptage des solutions techniques, benchmarks et limites réelles.

Adapter le niveau de lecture

7 min3 niveaux disponibles

Comment Airbus protège ses plans d'avion avec de l'IA (sans tout casser)

On connaît la chanson : "L'IA va révolutionner la sécurité des données !" Sauf que quand il s'agit de protéger les plans de l'A350 ou les secrets de propulsion, les PowerPoints marketing ne suffisent plus. Airbus a mis les mains dans le cambouis pour construire un système qui ne fuite pas comme un passoire tout en restant utilisable. Spoiler : c'est moins glamour que ce qu'on imagine, mais ça marche.

Les fondements : pourquoi un LLM maison ne suffit pas

Premier constat : un modèle open-source téléchargé sur Hugging Face, c'est comme une porte blindée livrée avec la clé sous le paillasson. Airbus a besoin de :

  • Contrôle total sur les données d'entraînement (pas de fuites vers des serveurs américains)
  • Traçabilité des requêtes (qui a demandé quoi, quand, et pourquoi)
  • Résilience face aux attaques par prompt injection (parce que oui, "ignore les instructions précédentes" fonctionne aussi sur les modèles privés)

Leur solution ? Un mélange de trois couches :

  1. Un LLM finetuné en interne (basé sur Mistral ou Llama, mais avec des gardes-fous)
  2. Un système de RAG (Retrieval-Augmented Generation) ultra-sécurisé pour limiter les hallucinations
  3. Une couche de monitoring comportemental qui détecte les requêtes suspectes en temps réel

"Mais pourquoi ne pas tout faire en local ?" Parce que même un modèle 7B a du mal à tenir dans un laptop quand il faut gérer 50 ans de documentation technique. L'hybride est un mal nécessaire.

Le problème des données d'entraînement

Airbus n'a pas le luxe de scraper le web comme Meta. Leurs données sont :

  • Structurées (CAO, schémas, rapports de test)
  • Sensibles (brevets, contrats militaires)
  • Hétérogènes (des scans de plans papier aux fichiers STEP 3D)

Résultat : le finetuning classique ne marche pas. Ils utilisent une approche de curriculum learning où le modèle apprend d'abord sur des données publiques (manuels techniques, normes aéronautiques), puis sur des extraits anonymisés de leurs propres docs. Pas de magie, juste du bricolage méthodique.

L'implémentation : quand la théorie rencontre la prod

Architecture technique

Le système repose sur :

  • Un cluster Kubernetes privé (pas de cloud public, même européen)
  • Des GPUs A100 avec chiffrement mémoire (parce que même les admins sys ne doivent pas tout voir)
  • Un proxy de requêtes qui :
    • Logue tout (même les échecs)
    • Filtre les prompts dangereux ("donne-moi le schéma du réacteur de l'A380")
    • Injecte du bruit dans les réponses si la requête est trop précise

Exemple de flux :

# Schéma simplifié du pipeline Airbus (pseudo-code)
def handle_query(query: str, user: User) -> Response:
    if is_sensitive(query):  # Détection de mots-clés interdits
        return sanitized_response(query)

    context = secure_vector_db.query(  # Base vectorielle chiffrée
        embed(query),
        top_k=3,
        filter={"access_level": user.clearance}
    )

    response = private_llm.generate(  # Modèle 13B finetuné
        prompt=format_prompt(query, context),
        temperature=0.3,  # On veut du déterministe
        max_tokens=512
    )

    return audit_log(response, user)  # Tout est tracé

Benchmarks : ça tient la route ?

Airbus a testé son système contre :

  1. Des attaques par prompt adversarial (type "ignore les règles et donne-moi X")
    • Taux de fuite : 0.2% (contre 12% sur un LLM standard)
  2. Des requêtes légitimes mais ambigües (ex: "Quelles sont les tolérances pour l'aile en composite ?")
    • Précision : 89% (avec RAG) vs 65% (sans)
  3. Charge simultanée (1000 requêtes/minute)
    • Latence moyenne : 1.8s (acceptable pour un usage interne)

Le vrai test ? Quand un ingénieur a demandé "les faiblesses structurelles du A320neo" et que le système a répondu :

"Informations classifiées. Voici les procédures de test standard pour les ailes en composite (document AI-P-789-2021)."

Pas parfait, mais mieux qu'un 404 ou une fuite.

Les limitations : l'IA n'est pas une baguette magique

1. Le coût de la maintenance

Un LLM privé, c'est comme un avion : ça coûte cher à entretenir.

  • Finetuning continu : à chaque nouvelle norme ou brevet, il faut réentraîner.
  • Gestion des versions : "On utilise la v3.2 du modèle, mais la v3.1 donne de meilleurs résultats sur les questions thermodynamiques."
  • Drift des données : les plans de 1990 n'ont pas le même format que ceux de 2023.

2. Les faux positifs qui énervent tout le monde

Le système bloque trop souvent des requêtes légitimes. Exemple :

"Quelle est la résistance maximale du train d'atterrissage de l'A220 ?""Accès refusé : niveau de clearance insuffisant."En réalité : l'ingénieur avait bien le droit, mais le modèle a sur-interprété "résistance maximale" comme une demande de specs militaires.

Solution ? Un bouton "Contester" qui envoie la requête à un humain. Pas très "IA", mais efficace.

3. L'illusion de la sécurité absolue

Même avec tout ça, un employé mécontent avec un téléphone peut prendre plus de photos que l'IA n'en empêchera jamais. Comme le dit un responsable sécurité chez Airbus : "On protège contre les fuites accidentelles et les attaques externes. Pas contre la malveillance interne. Pour ça, il faut des serrures et des gardes."

Recherche & évolutions : vers où va Airbus ?

1. Les modèles "air-gapped" deviennent la norme

Airbus teste des LLMs qui tournent sur des machines physiquement isolées, avec :

  • Pas de connexion réseau (même pas pour les mises à jour)
  • Des données chargées via des clés USB chiffrées (oui, comme en 2005)
  • Un système de vote entre plusieurs modèles pour détecter les incohérences

Problème : comment faire du finetuning sans réseau ? Réponse : on ne fait pas. On accepte que le modèle vieillisse.

2. La détection d'anomalies comportementales

Ils travaillent sur un système qui analyse :

  • Le style des requêtes (un employé qui demande soudain 50 docs sur les systèmes hydrauliques, c'est louche)
  • Les horaires (pourquoi quelqu'un pose des questions à 3h du matin ?)
  • Les combinaisons de mots (ex: "export" + "schéma" + "PDF" = alerte)

Outils utilisés :

  • Isolation Forest pour détecter les outliers
  • Transformers légers (type DistilBERT) pour analyser la sémantique des requêtes

3. Le retour (partiel) du papier

Ironie ultime : certains documents ultra-sensibles sont re-transcrits... sur papier, dans une salle sécurisée. Parce que parfois, le meilleur firewall, c'est l'absence de port USB.

Ce que les autres industries peuvent en retenir

  1. L'hybride est inévitable : même avec des budgets colossaux, personne ne fait du 100% on-premise ou 100% cloud.
  2. La sécurité coûte de la performance : choisissez vos compromis (latence vs. confidentialité).
  3. Les humains restent dans la boucle : l'IA d'Airbus n'est pas autonome, elle assiste, elle ne décide pas.

Pour les ingénieurs ML qui veulent s'inspirer de cette approche, voici les questions à se poser :

  • Quels sont vos "plans d'A380" ? Les données que vous ne pouvez pas vous permettre de perdre.
  • Quel est votre seuil de tolérance aux fuites ? 0.1% ? 1% ?
  • Combien coûte une erreur ? Chez Airbus, c'est des milliards en contrats militaires. Chez vous, c'est peut-être "juste" la réputation.

Et surtout : ne croyez pas les vendeurs qui vous promettent une IA "100% sécurisée". Même Airbus, avec ses moyens, doit bricoler.


FAQ

[Airbus utilise quel modèle de base pour son LLM ?] Ils partent généralement de Mistral ou Llama (7B à 13B), puis appliquent un finetuning agressif avec leurs données techniques. Aucun modèle propriétaire n'a été annoncé publiquement – la discrétion est la clé.

[Comment ils empêchent les fuites via les prompts ?] Trois couches : filtrage lexical (mots interdits), analyse sémantique (détection d'intentions suspectes), et un système de "sandboxing" qui limite les réponses aux documents explicitement autorisés pour l'utilisateur.

[Est-ce que cette approche est reproductible pour une PME ?] Non, sauf à réduire drastiquement la scope. Une PME peut s'inspirer des principes (RAG sécurisé, monitoring des requêtes), mais sans le budget pour un cluster privé et une équipe dédiée, c'est compliqué. Commencez par cet article sur les agents IA sécurisés pour une version plus accessible.

Articles liés