Anonimizator dokumentów
Usuń dane osobowe z pliku PDF, DOCX lub TXT
Przeciągnij plik tutaj lub wybierz z dysku
PDF · DOCX · TXT · maks. 20 MB
Pseudonimizacja danych osobowych
Narzędzie automatycznie wykrywa dane osobowe w dokumencie (imiona, nazwiska, e-maile, numery telefonów, PESEL, konta bankowe itp.) i zastępuje je neutralnymi tokenami.
Przykład: Jan Kowalski → [OSOBA_1], jan@firma.pl → [EMAIL_1]. Dokument nadaje się do dalszej pracy (np. analizy AI) bez ujawniania tożsamości.
To pseudonimizacja — oryginalne dane można przywrócić przy użyciu pobranej mapy tokenów.
Jak używać
- Wgraj plik PDF, DOCX lub TXT (do 20 MB) — przeciągnij go na pole lub kliknij i wybierz z dysku.
- Kliknij Anonimizuj i poczekaj kilka–kilkanaście sekund na przetworzenie.
- Pobierz dokument — plik z tokenami zamiast danych osobowych.
- Pobierz mapę tokenów — plik JSON z listą token → oryginalna wartość. Przechowuj bezpiecznie.
Do czego służy mapa?
Mapa tokenów to plik JSON z powiązaniami każdego tokenu z oryginalną wartością, np. "OSOBA_1": "Jan Kowalski".
Możesz użyć jej do ręcznego przywrócenia danych lub skorzystać z funkcji Przywróć oryginał — narzędzie automatycznie podmieni tokeny z powrotem.
Przywracanie oryginału
Jeśli po edycji zanonimizowanego dokumentu chcesz przywrócić prawdziwe dane:
- Po anonimizacji przewiń w dół do sekcji Przywróć oryginał.
- Wgraj zmodyfikowany plik (DOCX lub TXT) z tokenami.
- Kliknij Przywróć oryginał — narzędzie zastąpi tokeny oryginalnymi danymi.
Co obsługujemy
- PDF — tekst warstwy tekstowej (nie skany bez OCR)
- DOCX — dokumenty Word; formatowanie zachowane w najlepszym wysiłku
- TXT — zwykły tekst UTF-8
- Maksymalny rozmiar pliku: 20 MB
Czego model może nie wykryć
Wykrywanie opiera się na modelu AI i wyrażeniach regularnych — nie jest nieomylne:
- daty zapisane słownie (np. 1 marca 2020, dwudziesty drugi września)
- adresy e-mail w nagłówkach: Od: Imię <email@domena.pl>
- nazwy własne firm lub miejsc powiązanych z osobą
- treści zawarte w obrazach wklejonych do DOCX