Rimozione dei dati personali prima dell’utilizzo degli LLM

Che cos’è il PII?

PII sta per Personally Identifiable Information e indica i dati personali.

Include qualsiasi informazione che possa identificare una persona direttamente o indirettamente.

Esempi comuni di PII includono:

nomi completi
indirizzi e-mail
numeri di telefono
indirizzi di casa
numeri di passaporto o documento d’identità
ID cliente
IBAN e dati bancari
informazioni mediche
ticket di assistenza contenenti dati personali
informazioni aziendali interne collegate a persone

In molti documenti reali, compaiono insieme più tipi di PII.

Perché i PII sono importanti quando si utilizzano gli LLM

I Large Language Models (LLM) come ChatGPT, Claude, Gemini, Copilot, Grok e altri assistenti IA vengono sempre più utilizzati per:

riassumere documenti
riscrivere e-mail
analizzare richieste di supporto
estrarre informazioni
traduzione
ricerca
generazione di bozze
assistenza alla programmazione

Per utilizzare questi sistemi, le persone spesso incollano testo grezzo direttamente in chatbot IA o piattaforme di IA generativa.

Il problema è che questi testi contengono frequentemente informazioni sensibili, personali o riservate.

Gli utenti possono condividere involontariamente dati privati, informazioni sui clienti, dati dei pazienti, documenti interni o informazioni protette legalmente con sistemi IA esterni.

Esempi di dati sensibili nei prompt LLM

Le informazioni sensibili all'interno dei prompt possono includere:

conversazioni con i clienti
cartelle cliniche
contratti
ticket di supporto
comunicazioni dei dipendenti
documenti legali
dati finanziari
materiale di ricerca
messaggi privati

Anche un testo apparentemente innocuo può contenere identificatori nascosti che possono esporre individui o informazioni aziendali riservate.

Un flusso di lavoro più sicuro prima di utilizzare l'IA

Un flusso di lavoro più sicuro prima di utilizzare gli LLM è:

Rilevare automaticamente le informazioni sensibili
Oscurare, anonimizzare o pseudonimizzare il testo
Utilizzare la versione ripulita con sistemi di IA
Ripristinare successivamente in locale i segnaposto pseudonimizzati, se necessario

Questo aiuta a ridurre i rischi relativi a privacy, sicurezza e conformità, mantenendo comunque il testo utile per attività assistite dall’IA.

Esempio

Testo originale

Il cliente Sarah Johnson di London ha contattato il supporto in merito all’account AC-48372.
Il suo indirizzo e-mail è [email protected] e il suo numero di telefono è +44 7700 900123.

Versione pseudonimizzata

Il cliente [PERSON_1] di [LOCATION_1] ha contattato il supporto in merito all’account [SECRET_1].
Il suo indirizzo e-mail è [EMAIL_1] e il suo numero di telefono è [PHONE_1].

Il contesto importante rimane intatto mentre le informazioni personali identificabili vengono rimosse.

Perché la rimozione locale dei PII è importante

Molti strumenti di anonimizzazione o privacy per l’IA richiedono agli utenti di caricare documenti o testi su un servizio cloud.

Nel caso di dati sensibili, ciò può creare problemi di privacy o conformità.

Redaxa funziona localmente sul proprio PC.

Nessuna elaborazione nel cloud. Nessuna IA esterna richiesta. Nessun caricamento di documenti.

Questo rende Redaxa adatto per:

flussi di lavoro sensibili al GDPR
ambienti legali e sanitari
istituti di ricerca
comunicazione aziendale
utenti che lavorano con documenti riservati
preparare testi prima di utilizzare LLM o assistenti IA

Prepari il testo in modo sicuro prima di utilizzare l’IA

Redaxa aiuta gli utenti a preparare il testo in modo sicuro prima di inviarlo a ChatGPT, Claude, Gemini, Copilot, Grok o altri LLM.

rilevare automaticamente i PII
evidenziare informazioni sensibili
oscurare dati personali
anonimizzare o pseudonimizzare il testo
preparare prompt in modo sicuro prima di utilizzare sistemi di IA

L’applicazione funziona localmente e supporta più lingue.