Suppression des données personnelles avant l’utilisation des LLM

Qu’est-ce que le PII ?

PII signifie Personally Identifiable Information et désigne des données à caractère personnel.

Cela inclut toute information permettant d’identifier une personne directement ou indirectement.

Exemples courants de PII :

noms complets
adresses e-mail
numéros de téléphone
adresses personnelles
numéros de passeport ou de carte d’identité
identifiants clients
IBAN et coordonnées bancaires
informations médicales
tickets de support contenant des données personnelles
informations commerciales internes liées à des personnes

Dans de nombreux documents réels, plusieurs types de PII apparaissent ensemble.

Pourquoi les PII sont importantes lors de l’utilisation des LLM

Les grands modèles de langage (LLM) tels que ChatGPT, Claude, Gemini, Copilot, Grok et d'autres assistants IA sont de plus en plus utilisés pour :

résumer des documents
réécrire des e-mails
analyser des demandes de support
extraire des informations
la traduction
la recherche
la génération de brouillons
l’assistance au codage

Pour utiliser ces systèmes, les utilisateurs collent souvent du texte brut directement dans des chatbots IA ou des plateformes d’IA générative.

Le problème est que ces textes contiennent fréquemment des informations sensibles, personnelles ou confidentielles.

Les utilisateurs peuvent partager involontairement des données privées, des informations clients, des données patients, des documents internes ou des informations légalement protégées avec des systèmes d’IA externes.

Exemples de données sensibles dans les prompts LLM

Les informations sensibles dans les prompts peuvent inclure :

des conversations avec des clients
des dossiers médicaux
des contrats
des tickets d’assistance
des communications entre employés
des documents juridiques
des données financières
du matériel de recherche
des messages privés

Même un texte apparemment inoffensif peut contenir des identifiants cachés susceptibles d’exposer des individus ou des informations commerciales confidentielles.

Un flux de travail plus sûr avant d’utiliser l’IA

Un flux de travail plus sûr avant d’utiliser des LLM consiste à :

Détecter automatiquement les informations sensibles
Masquer, anonymiser ou pseudonymiser le texte
Utiliser la version nettoyée avec des systèmes d’IA
Restaurer ensuite localement les espaces réservés pseudonymisés si nécessaire

Cela permet de réduire les risques liés à la confidentialité, à la sécurité et à la conformité tout en conservant l’utilité du texte pour les tâches assistées par IA.

Exemple

Texte original

Le client Sarah Johnson de London a contacté le support concernant le compte AC-48372.
Son adresse e-mail est [email protected] et son numéro de téléphone est +44 7700 900123.

Version pseudonymisée

Le client [PERSON_1] de [LOCATION_1] a contacté le support concernant le compte [SECRET_1].
Son adresse e-mail est [EMAIL_1] et son numéro de téléphone est [PHONE_1].

Le contexte important reste intact tandis que les informations personnelles identifiables sont supprimées.

Pourquoi la suppression locale des PII est importante

De nombreux outils d’anonymisation ou de confidentialité pour l’IA exigent que les utilisateurs téléversent des documents ou du texte vers un service cloud.

Pour les données sensibles, cela peut en soi créer des problèmes de confidentialité ou de conformité.

Redaxa fonctionne localement sur votre propre PC.

Aucun traitement dans le cloud. Aucune IA externe requise. Aucun téléversement de document.

Cela rend Redaxa adapté à :

des flux de travail sensibles au RGPD
des environnements juridiques et médicaux
des institutions de recherche
la communication d’entreprise
les utilisateurs travaillant avec des documents confidentiels
la préparation de textes avant l’utilisation de LLM ou d’assistants IA

Préparez du texte en toute sécurité avant d’utiliser l’IA

Redaxa aide les utilisateurs à préparer du texte en toute sécurité avant de l’envoyer à ChatGPT, Claude, Gemini, Copilot, Grok ou d’autres LLM.

détecter automatiquement les PII
mettre en évidence les informations sensibles
masquer les données personnelles
anonymiser ou pseudonymiser le texte
préparer des prompts en toute sécurité avant d’utiliser des systèmes d’IA

L’application fonctionne localement et prend en charge plusieurs langues.