PII verwijderen voordat LLM's worden gebruikt
Hoe u gevoelige tekst veilig voorbereidt voordat u AI-systemen gebruikt
Wat is PII?
Dit omvat alle informatie waarmee een persoon direct of indirect kan worden geïdentificeerd.
Veelvoorkomende voorbeelden van PII zijn:
- volledige namen
- e-mailadressen
- telefoonnummers
- woonadressen
- paspoort- of identiteitsnummers
- klant-ID’s
- IBAN’s en bankgegevens
- medische informatie
- supporttickets met persoonsgegevens
- interne bedrijfsinformatie gekoppeld aan personen
In veel praktijkdocumenten komen meerdere soorten PII samen voor.
Waarom PII belangrijk is bij het gebruik van LLM’s
- het samenvatten van documenten
- het herschrijven van e-mails
- het analyseren van supportverzoeken
- het extraheren van informatie
- vertaling
- onderzoek
- het genereren van concepten
- ondersteuning bij programmeren
Om deze systemen te gebruiken, plakken mensen vaak ruwe tekst rechtstreeks in AI-chatbots of generatieve AI-platforms.
Het probleem is dat deze teksten vaak gevoelige persoonlijke of vertrouwelijke informatie bevatten.
Gebruikers kunnen onbedoeld privégegevens, klantinformatie, patiëntgegevens, interne documenten of wettelijk beschermde informatie delen met externe AI-systemen.
Voorbeelden van gevoelige gegevens in LLM-prompts
- klantgesprekken
- medische dossiers
- contracten
- supporttickets
- communicatie van medewerkers
- juridische documenten
- financiële gegevens
- onderzoeksmateriaal
- privéberichten
Zelfs ogenschijnlijk onschuldige tekst kan verborgen identificatoren bevatten die personen of vertrouwelijke bedrijfsinformatie kunnen blootstellen.
Een veiligere workflow vóór het gebruik van AI
Een veiligere workflow vóór het gebruik van LLM’s is:
- Gevoelige informatie automatisch detecteren
- De tekst redigeren, anonimiseren of pseudonimiseren
- De opgeschoonde versie gebruiken met AI-systemen
- Indien nodig achteraf lokaal gepseudonimiseerde placeholders herstellen
Dit helpt privacy-, beveiligings- en compliancerisico’s te verminderen, terwijl de tekst bruikbaar blijft voor AI-ondersteunde taken.
Voorbeeld
Originele tekst
Klant Sarah Johnson uit London nam contact op met de ondersteuning met betrekking tot account AC-48372.
Haar e-mailadres is [email protected] en haar telefoonnummer is +44 7700 900123.
Gepseudonimiseerde versie
Klant [PERSON_1] uit [LOCATION_1] nam contact op met de ondersteuning met betrekking tot account [SECRET_1].
Haar e-mailadres is [EMAIL_1] en haar telefoonnummer is [PHONE_1].
De belangrijke context blijft behouden terwijl persoonlijk identificeerbare informatie wordt verwijderd.
Waarom lokale verwijdering van PII belangrijk is
Bij gevoelige gegevens kan dit zelf privacy- of complianceproblemen veroorzaken.
Redaxa werkt lokaal op uw eigen pc.
Geen cloudverwerking. Geen externe AI vereist. Geen documentuploads.
Daardoor is Redaxa geschikt voor:
- AVG-gevoelige workflows
- juridische en medische omgevingen
- onderzoeksinstellingen
- zakelijke communicatie
- gebruikers die met vertrouwelijke documenten werken
- het voorbereiden van tekst voordat LLM’s of AI-assistenten worden gebruikt
Tekst veilig voorbereiden voordat AI wordt gebruikt
- PII automatisch detecteren
- gevoelige informatie markeren
- persoonsgegevens afschermen
- tekst anonimiseren of pseudonimiseren
- prompts veilig voorbereiden voordat AI-systemen worden gebruikt
De applicatie werkt lokaal en ondersteunt meerdere talen.