Supprimer les PII avant d’utiliser des LLM
Comment préparer des textes sensibles en toute sécurité avant d’utiliser des systèmes d’IA
Qu’est-ce que le PII ?
Cela inclut toute information permettant d’identifier une personne directement ou indirectement.
Exemples courants de PII :
- noms complets
- adresses e-mail
- numéros de téléphone
- adresses personnelles
- numéros de passeport ou de carte d’identité
- identifiants clients
- IBAN et coordonnées bancaires
- informations médicales
- tickets de support contenant des données personnelles
- informations commerciales internes liées à des personnes
Dans de nombreux documents réels, plusieurs types de PII apparaissent ensemble.
Pourquoi les PII sont importantes lors de l’utilisation des LLM
- résumer des documents
- réécrire des e-mails
- analyser des demandes de support
- extraire des informations
- la traduction
- la recherche
- la génération de brouillons
- l’assistance au codage
Pour utiliser ces systèmes, les utilisateurs collent souvent du texte brut directement dans des chatbots IA ou des plateformes d’IA générative.
Le problème est que ces textes contiennent fréquemment des informations sensibles, personnelles ou confidentielles.
Les utilisateurs peuvent partager involontairement des données privées, des informations clients, des données patients, des documents internes ou des informations légalement protégées avec des systèmes d’IA externes.
Exemples de données sensibles dans les prompts LLM
- des conversations avec des clients
- des dossiers médicaux
- des contrats
- des tickets d’assistance
- des communications entre employés
- des documents juridiques
- des données financières
- du matériel de recherche
- des messages privés
Même un texte apparemment inoffensif peut contenir des identifiants cachés susceptibles d’exposer des individus ou des informations commerciales confidentielles.
Un flux de travail plus sûr avant d’utiliser l’IA
Un flux de travail plus sûr avant d’utiliser des LLM consiste à :
- Détecter automatiquement les informations sensibles
- Masquer, anonymiser ou pseudonymiser le texte
- Utiliser la version nettoyée avec des systèmes d’IA
- Restaurer ensuite localement les espaces réservés pseudonymisés si nécessaire
Cela permet de réduire les risques liés à la confidentialité, à la sécurité et à la conformité tout en conservant l’utilité du texte pour les tâches assistées par IA.
Exemple
Texte original
Le client Sarah Johnson de London a contacté le support concernant le compte AC-48372.
Son adresse e-mail est [email protected] et son numéro de téléphone est +44 7700 900123.
Version pseudonymisée
Le client [PERSON_1] de [LOCATION_1] a contacté le support concernant le compte [SECRET_1].
Son adresse e-mail est [EMAIL_1] et son numéro de téléphone est [PHONE_1].
Le contexte important reste intact tandis que les informations personnelles identifiables sont supprimées.
Pourquoi la suppression locale des PII est importante
Pour les données sensibles, cela peut en soi créer des problèmes de confidentialité ou de conformité.
Redaxa fonctionne localement sur votre propre PC.
Aucun traitement dans le cloud. Aucune IA externe requise. Aucun téléversement de document.
Cela rend Redaxa adapté à :
- des flux de travail sensibles au RGPD
- des environnements juridiques et médicaux
- des institutions de recherche
- la communication d’entreprise
- les utilisateurs travaillant avec des documents confidentiels
- la préparation de textes avant l’utilisation de LLM ou d’assistants IA
Préparez du texte en toute sécurité avant d’utiliser l’IA
- détecter automatiquement les PII
- mettre en évidence les informations sensibles
- masquer les données personnelles
- anonymiser ou pseudonymiser le texte
- préparer des prompts en toute sécurité avant d’utiliser des systèmes d’IA
L’application fonctionne localement et prend en charge plusieurs langues.