Rimuovere i PII prima di utilizzare gli LLM
Come preparare in modo sicuro testi sensibili prima di utilizzare sistemi di IA
Che cos’è il PII?
Include qualsiasi informazione che possa identificare una persona direttamente o indirettamente.
Esempi comuni di PII includono:
- nomi completi
- indirizzi e-mail
- numeri di telefono
- indirizzi di casa
- numeri di passaporto o documento d’identità
- ID cliente
- IBAN e dati bancari
- informazioni mediche
- ticket di assistenza contenenti dati personali
- informazioni aziendali interne collegate a persone
In molti documenti reali, compaiono insieme più tipi di PII.
Perché i PII sono importanti quando si utilizzano gli LLM
- riassumere documenti
- riscrivere e-mail
- analizzare richieste di supporto
- estrarre informazioni
- traduzione
- ricerca
- generazione di bozze
- assistenza alla programmazione
Per utilizzare questi sistemi, le persone spesso incollano testo grezzo direttamente in chatbot IA o piattaforme di IA generativa.
Il problema è che questi testi contengono frequentemente informazioni sensibili, personali o riservate.
Gli utenti possono condividere involontariamente dati privati, informazioni sui clienti, dati dei pazienti, documenti interni o informazioni protette legalmente con sistemi IA esterni.
Esempi di dati sensibili nei prompt LLM
- conversazioni con i clienti
- cartelle cliniche
- contratti
- ticket di supporto
- comunicazioni dei dipendenti
- documenti legali
- dati finanziari
- materiale di ricerca
- messaggi privati
Anche un testo apparentemente innocuo può contenere identificatori nascosti che possono esporre individui o informazioni aziendali riservate.
Un flusso di lavoro più sicuro prima di utilizzare l'IA
Un flusso di lavoro più sicuro prima di utilizzare gli LLM è:
- Rilevare automaticamente le informazioni sensibili
- Oscurare, anonimizzare o pseudonimizzare il testo
- Utilizzare la versione ripulita con sistemi di IA
- Ripristinare successivamente in locale i segnaposto pseudonimizzati, se necessario
Questo aiuta a ridurre i rischi relativi a privacy, sicurezza e conformità, mantenendo comunque il testo utile per attività assistite dall’IA.
Esempio
Testo originale
Il cliente Sarah Johnson di London ha contattato il supporto in merito all’account AC-48372.
Il suo indirizzo e-mail è [email protected] e il suo numero di telefono è +44 7700 900123.
Versione pseudonimizzata
Il cliente [PERSON_1] di [LOCATION_1] ha contattato il supporto in merito all’account [SECRET_1].
Il suo indirizzo e-mail è [EMAIL_1] e il suo numero di telefono è [PHONE_1].
Il contesto importante rimane intatto mentre le informazioni personali identificabili vengono rimosse.
Perché la rimozione locale dei PII è importante
Nel caso di dati sensibili, ciò può creare problemi di privacy o conformità.
Redaxa funziona localmente sul proprio PC.
Nessuna elaborazione nel cloud. Nessuna IA esterna richiesta. Nessun caricamento di documenti.
Questo rende Redaxa adatto per:
- flussi di lavoro sensibili al GDPR
- ambienti legali e sanitari
- istituti di ricerca
- comunicazione aziendale
- utenti che lavorano con documenti riservati
- preparare testi prima di utilizzare LLM o assistenti IA
Prepari il testo in modo sicuro prima di utilizzare l’IA
- rilevare automaticamente i PII
- evidenziare informazioni sensibili
- oscurare dati personali
- anonimizzare o pseudonimizzare il testo
- preparare prompt in modo sicuro prima di utilizzare sistemi di IA
L’applicazione funziona localmente e supporta più lingue.