Noņemt PII pirms LLM izmantošanas
Kā droši sagatavot sensitīvu tekstu pirms AI sistēmu izmantošanas
Kas ir PII?
Tā ietver jebkādu informāciju, kas var tieši vai netieši identificēt personu.
Biežākie PII piemēri:
- pilni vārdi
- e-pasta adreses
- tālruņu numuri
- mājas adreses
- pases vai ID numuri
- klientu ID
- IBAN un bankas dati
- medicīniskā informācija
- atbalsta pieprasījumi ar personas datiem
- iekšēja uzņēmuma informācija, kas saistīta ar personām
Daudzos reālos dokumentos vienlaikus parādās vairāki PII veidi.
Kāpēc PII ir svarīga, izmantojot LLM
- dokumentu apkopošanai
- e-pastu pārrakstīšanai
- atbalsta pieprasījumu analīzei
- informācijas iegūšanai
- tulkošanai
- izpētei
- melnrakstu ģenerēšanai
- programmēšanas atbalstam
Lai izmantotu šīs sistēmas, cilvēki bieži ievieto neapstrādātu tekstu tieši MI tērzēšanas robotos vai ģeneratīvā MI platformās.
Problēma ir tāda, ka šie teksti bieži satur sensitīvu personas vai konfidenciālu informāciju.
Lietotāji var nejauši kopīgot privātus datus, klientu informāciju, pacientu datus, iekšējos dokumentus vai juridiski aizsargātu informāciju ar ārējām MI sistēmām.
Sensitīvu datu piemēri LLM uzvednēs
- klientu sarunas
- medicīniskos ierakstus
- līgumus
- atbalsta pieprasījumus
- darbinieku saziņu
- juridiskus dokumentus
- finanšu datus
- pētniecības materiālus
- privātas ziņas
Pat šķietami nekaitīgs teksts var saturēt slēptus identifikatorus, kas var atklāt personas vai konfidenciālu uzņēmuma informāciju.
Drošāka darbplūsma pirms MI izmantošanas
Drošāka darbplūsma pirms LLM izmantošanas ir:
- Automātiski noteikt sensitīvu informāciju
- Rediģēt, anonimizēt vai pseidonimizēt tekstu
- Izmantot attīrīto versiju ar MI sistēmām
- Ja nepieciešams, pēc tam lokāli atjaunot pseidonimizētos vietturus
Tas palīdz samazināt privātuma, drošības un atbilstības riskus, vienlaikus saglabājot tekstu noderīgu MI atbalstītiem uzdevumiem.
Piemērs
Oriģinālais teksts
Klients Sarah Johnson no London sazinājās ar atbalsta dienestu saistībā ar kontu AC-48372.
Viņas e-pasta adrese ir [email protected] un viņas tālruņa numurs ir +44 7700 900123.
Pseidonimizēta versija
Klients [PERSON_1] no [LOCATION_1] sazinājās ar atbalsta dienestu saistībā ar kontu [SECRET_1].
Viņas e-pasta adrese ir [EMAIL_1] un viņas tālruņa numurs ir [PHONE_1].
Svarīgais konteksts paliek saglabāts, kamēr personu identificējošā informācija tiek noņemta.
Kāpēc lokāla PII noņemšana ir svarīga
Strādājot ar sensitīviem datiem, tas pats par sevi var radīt privātuma vai atbilstības riskus.
Redaxa darbojas lokāli jūsu datorā.
Bez mākoņapstrādes. Bez ārēja MI. Bez dokumentu augšupielādes.
Tas padara Redaxa piemērotu:
- VDAR jutīgām darbplūsmām
- juridiskai un veselības aprūpes videi
- pētniecības iestādēm
- biznesa saziņai
- lietotājiem, kuri strādā ar konfidenciāliem dokumentiem
- teksta sagatavošanai pirms LLM vai MI asistentu izmantošanas
Droši sagatavojiet tekstu pirms MI izmantošanas
- automātiski noteikt PII
- izcelt sensitīvu informāciju
- aizklāt personas datus
- anonimizēt vai pseidonimizēt tekstu
- droši sagatavot uzvednes pirms MI sistēmu izmantošanas
Lietotne darbojas lokāli un atbalsta vairākas valodas.