🧪 Wissenschaftlich fundierte Text-Anonymisierung

Texte automatisch anonymisieren.
Daten nutzen.

PII-Erkennung auf Forschungsniveau für Mac, Windows, Linux und Mobilgeräte. Skalieren Sie von einzelnen Forschungsarbeiten bis zu unternehmensweiten Cloud-APIs.

Reports
Eingabetext

"Jane Doe wohnt in der Baker St 123 und arbeitet bei Apple."

Textwash Pro
Anonymisierte Ausgabe

"PERSON_1 wohnt in ADRESSE_1 und arbeitet bei ORG_1."

Entwickelt für smarten Datenschutz

Keine Programmierung erforderlich Intuitive Benutzeroberfläche für Forschende und nicht-technische Teams.
Für isolierte Umgebungen geeignet Lokale Verarbeitung stellt sicher, dass Daten Ihre Infrastruktur nie verlassen.
ML-gestützte Entitätserkennung Probabilistische Entitätserkennung übertrifft statische Wörterbuchlisten.
Gegen Re-Identifikation getestet Empirisch gegen menschliche Re-Identifizierungsversuche validiert.

Kernprinzipien

Wissenschaftliche Grundlage

Basiert auf dem renommierten Textwash-Projekt (GPL-3.0). Prüfbar, transparent und von Forschenden entwickelt.

Kontextbezogener Datenschutz

Nutzt Kategorienwahrscheinlichkeiten, um Phrasen anhand sprachlichen Kontexts zu anonymisieren – nicht nur über einfache Schlüsselwörter.

Lokale Architektur

Für sensible institutionelle Daten konzipiert. Für die Desktop-Anwendung ist keine Internetverbindung erforderlich.

ISO-9001-zertifiziertes Entwicklungsunternehmen

🧩 Produktfamilie

Wählen Sie die Bereitstellung, die am besten zu Ihrem Arbeitsablauf passt – von der benutzerfreundlichen Desktop-App über Cloud-APIs bis zum ursprünglichen quelloffenen Skript.

Alle Varianten basieren auf demselben forschungsbasierten Anonymisierungsansatz und Evaluationsrahmen.

Desktop- & Mobil-App

Textwash Pro

Mac · Windows · Linux · iOS · Android

Eine benutzerfreundliche Anwendung, die vollständig auf Ihren Geräten läuft. Importieren Sie unstrukturierte Textdaten und exportieren Sie anonymisierte Versionen, ohne etwas an externe Server zu senden.

Unterstützt Englisch, Niederländisch, Französisch, Spanisch, Deutsch, Italienisch und viele weitere Sprachen; entwickelt für eine einfache Nutzung ohne technische Vorkenntnisse.

Standardmäßig offline · GUI-basiert
API & Integrationen

Textwash Pro API

Cloudbasierte Verarbeitung · Zapier-fähig

Cloud-API zur Integration der Textwash-Anonymisierung in Ihre eigenen Systeme und Arbeitsabläufe. Ideal für automatisierte Pipelines, Web-Apps und Low-Code-Werkzeuge wie Zapier.

Verarbeiten Sie Texte aus Formularen, CRM-Systemen oder Tickets vor Speicherung oder Analyse.

REST-API · Integrationen
Cloud-Arbeitsbereich

Textwash Pro Cloud

Browserbasierte Stapelverarbeitung

Nutzen Sie Textwash in einer von uns gehosteten Cloud-Umgebung oder in der Cloud Ihres Unternehmens. Laden Sie Datensätze hoch, konfigurieren Sie Entitätstypen und führen Sie Anonymisierungsaufträge direkt in Ihrem Browser aus.

Ideal für Teams, die gemeinsame Projektdashboards und Ergebnisprotokolle benötigen.

Teamfähig · Jobüberwachung
Quelloffene Grundlage

Textwash Free

Originalskript · Keine GUI

Das ursprüngliche quelloffene Textwash-Projekt, auf dem Textwash Pro aufbaut. Ein skriptbasiertes Anonymisierungswerkzeug ohne grafische Oberfläche, gedacht für technische Nutzerinnen und Nutzer die direkten Zugriff auf den zugrunde liegenden Code wünschen.

Enthält die vollständige Anonymisierungspipeline und Evaluationsmaterialien unter GPL-3.0.

Quellcode & Fachartikel Das quelloffene Original

🏢 Typische Anwendungsfälle

Textwash Pro wurde entwickelt, um reale Anonymisierungs-Arbeitsabläufe in Forschung, Industrie und öffentlichem Sektor zu unterstützen.

Wenn Ihr Anwendungsfall unstrukturierte Texte und personenbezogene Daten umfasst, ist Textwash Pro sehr wahrscheinlich relevant. Nicht sicher? Schreiben Sie uns an textwash-pro@jocapps.eu

DSGVO-konforme Datenanonymisierung

Anonymisieren Sie Freitextfelder mit personenbezogenen Daten, bevor sie gespeichert oder geteilt werden:

  • Kundenservice-Protokolle und E-Mail-Archive
  • Kontaktformulare und CRM-Notizen
  • Interne Berichte mit narrativen Beschreibungen

Offene Wissenschaft & Datenteilung

Bereiten Sie Forschungsdatensätze für die Weitergabe auf und schützen Sie dabei die Identitäten der Teilnehmenden:

  • Offene Antworten aus Umfragen
  • Interview- und Fokusgruppen-Transkripte
  • Feldnotizen und qualitative Forschungsdaten

Rechts-, Gesundheits- & Sozialwesen

Entfernen Sie direkte und indirekte Identifikatoren aus sensiblen Fallbeschreibungen:

  • Klinische Notizen und Fallvignetten
  • Zusammenfassungen juristischer Fälle und Memos
  • Dokumentationen und Protokolle aus der Sozialarbeit

Nutzerforschung & UX-Feedback

Anonymisieren Sie qualitatives Feedback, bevor es intern oder mit externen Partnern geteilt wird:

  • Nutzerinterviews und Usability-Tests
  • App-Store-Bewertungen und Hilfetickets
  • Interne Notizen aus der Produktfindung

Protokoll- & Überwachungsdaten

Entfernen Sie PII aus halbstrukturierten Logs vor zentraler Speicherung oder Analyse:

  • Anwendungs- und Server-Logs mit Nutzerdetails
  • Chatprotokolle aus Hilfesystemen
  • Exportierte Prüfpfade und Überwachungsausgaben

Proxy & Vorverarbeitung für LLM-Arbeitsabläufe

Leiten Sie Prompts und Freitext-Eingaben vor dem Erreichen externer oder interner LLM-Systeme durch die Anonymisierung:

  • PII-sicherer Prompt-Proxy für gemeinsam genutzte KI-Assistenten
  • Vorverarbeitung von Hilfetickets vor der Zusammenfassung
  • Maskierung von Identifikatoren vor Retrieval, Ranking und Generierung

🏛️ Individuelle institutionelle Arbeitsabläufe

Wir entwickeln durchgängige Anonymisierungs-Arbeitsabläufe, die mit institutioneller Governance, rechtlichen Vorgaben und Forschungsqualitätsstandards im Einklang stehen.

📋 Governance-Abstimmung

Richtlinienabgleich, Aufbewahrungsdefinitionen und Freigabepunkte für jede Stufe des Datenflusses

🛡️ Kontrollierte Verarbeitung

Rollenbasierte Zugriffskonzepte, sichere Prüfschleifen und Datenschutzkontrollen für interne und externe Teams

📈 Audit-Bereitschaft

Dokumentierte Verfahren, Qualitätsnachweise und wiederholbare Validierungsprotokolle für Compliance-Prüfungen

Für institutionelle Einführungen, Integrationsplanung oder Compliance-Fragen kontaktieren Sie textwash-pro@jocapps.eu

🤝 Optionale Dienstleistungen

Textwash Pro funktioniert als eigenständiges Produkt. Bei Bedarf bieten wir zusätzlich optionale Implementierungs- und Beratungsunterstützung für Forschungsteams, Unternehmen und Organisationen des öffentlichen Sektors.

Beratungs- und Implementierungsunterstützung

Das optionale Dienstleistungspaket verbindet Betriebsdesign, Integrationsplanung und Qualitätssicherung für sensible Text-Arbeitsabläufe.

  • Bewertung von Arbeitsabläufen für Datenschutz, Compliance und Datennutzen
  • PII-Vorverarbeitung und Schutzleitplanken vor dem Modelleinsatz
  • Nachverarbeitungsprüfungen der Ausgaben zur Reduktion von Datenabflussrisiken
  • Abgleich zwischen Anonymisierungsqualität und Geschäftsanforderungen
  • Mensch-in-der-Schleife-Strategien für Datensätze mit hoher Tragweite
  • Integrationsempfehlungen für lokale und Cloud-Architekturen

🔎  Phase 1: Analyse

  • Analyse der Datenlandschaft
  • Risiko- und Expositionszuordnung
  • Definition des Ziel-Arbeitsablaufs

🧪  Phase 2: Pilotierung

  • Onboarding von Datensätzen
  • Kalibrierung der Entitätstypen
  • Einrichtung menschlicher Qualitätsprüfungen

⚙️  Phase 3: Integration

  • System- und API-Integration
  • Erstellung eines operativen Runbooks
  • Einführung eines Überwachungs-Dashboards

✅  Phase 4: Governance

  • Prüf- und Nachweisüberprüfungen
  • Richtlinien- und Schulungspaket
  • Kontinuierliche Verbesserungen

Optionale Dienstleistungen sind verfügbar für KMU, Großunternehmen, Hochschulen, Gesundheitswesen und den öffentlichen Sektor

Entwickelt für anspruchsvolle Datenschutzarbeit

Textwash Pro wurde entwickelt, um hohe Standards der Textanonymisierung zu erfüllen. Die folgenden Prinzipien leiten die Weiterentwicklung.

1. Vollständige und transparente Evaluation

Der zugrundeliegende Anonymisierungsansatz wurde empirisch evaluiert. Dazu gehören Tests, was das Werkzeug leisten kann und was nicht, sowie einen Eindringlingstest, bei dem Menschen versuchen, Personen in anonymisierten Dokumenten wiederzuerkennen.

2. Daten verlassen Ihr System nicht

Die Textwash-Pro-Anwendung erfordert weder das Hochladen von Textdaten noch die Nutzung einer entfernten API. Sie können die Internetverbindung trennen und weiterhin Dokumente anonymisieren. Das minimiert Datenabfluss und reduziert Risiken bei sensiblen Daten.

3. Transparente Grundlagen

Textwash Pro basiert auf dem offenen, forschungsgetriebenen Textwash-Projekt. Die Grundlagen können von der Community eingesehen, getestet und erweitert werden.

4. Lernbasierte Anonymisierung

Personenbezogene Informationen sind komplex und kontextabhängig. Deshalb stützt sich Textwash nicht auf einfache Wörterbuchabgleiche. Stattdessen nutzt es ein Machine-Learning-Modell, das Phrasen Kategorie-Wahrscheinlichkeiten zuweist und sie entsprechend anonymisiert.

Prüfen Sie auch andere Anonymisierungstools?

Auch wenn Sie Textwash Pro nicht nutzen, empfehlen wir ausdrücklich, von jedem Werkzeuganbieter Folgendes einzufordern:

  1. Eine empirische Evaluation, die klar zeigt, was das Werkzeug kann und was nicht (Sie können dabei auf den Textwash-Evaluationsansatz und Datensatz verweisen)
  2. Eine klare Begründung, warum Daten an Online-Dienste oder APIs gesendet werden müssen, denn in vielen Fällen erfordert starke Anonymisierung keine zentrale Datensammlung

Wenn dieses Maß an Transparenz fehlt, sollten Risikoaussagen mit Vorsicht betrachtet werden

Sie erreichen uns jederzeit unter textwash-pro@jocapps.eu bei Rückfragen.

Europäische Datenschutzgesetze (DSGVO)

Compliance-by-Design statt nachträglicher Ergänzung

Textwash Pro ist zu 100% bereit für aktuelle EU-Datenschutzanforderungen und entspricht den DSGVO-Grundsätzen, insbesondere Datenminimierung, Zweckbindung sowie Datenschutz durch Technikgestaltung und datenschutzfreundliche Voreinstellungen (Art. 5 und 25 DSGVO).

Europäische KI-Souveränität

Vollständig lokale Bereitstellung auf Windows, Linux und macOS

Die Windows/Linux/macOS-App läuft vollständig lokal, offline und air-gapped. Es verlassen keine Daten die Client-Umgebung, und es sind keine externen APIs erforderlich.

❓ FAQ

Häufige Fragen zu Betriebsmodellen, Unterstützungsniveaus und Governance-Anforderungen

❓ Ist Textwash Pro ohne optionale Dienstleistungen nutzbar?

Ja. Das Produkt ist vollständig eigenständig nutzbar, und Dienstleistungen sind optional.

❓ Bieten Sie SLA-Optionen an?

Ja. Wir können für qualifizierte Organisationen Servicelevels, Unterstützungszeiten, Reaktionsziele und Eskalationspfade definieren.

❓ Ist Textwash Pro für Programme im öffentlichen Sektor geeignet?

Ja. Wir unterstützen öffentlichen Sektor, Forschung, Gesundheitswesen und regulierte Umgebungen mit governance-konformen Einführungsplänen.

❓ Können On-Premise- und Cloud-Bereitstellungen kombiniert werden?

Ja. Hybride Architekturen können lokale Verarbeitung mit API- oder Cloud-Komponenten kombinieren – abhängig von Richtlinien und Risikovorgaben.

❓ Wie unterstützen Sie Audits und Compliance-Prüfungen?

Wir liefern Dokumentationsbeiträge, Qualitätskontrollpunkte und Umsetzungsnachweise zur Unterstützung interner Governance und externer Audits.

❓ Wer sollte Sie für einen unternehmensweiten oder institutionellen Rollout kontaktieren?

Programmmanager, Datenschutzteams und technische Leitungen können uns unter textwash-pro@jocapps.eu kontaktieren, um Eignung und Rollout-Optionen zu besprechen.

❓ Wie unterstützt Textwash Pro die DSGVO-Compliance in der Praxis?

Textwash Pro ist auf DSGVO-Grundsätze wie Datenminimierung, Zweckbindung sowie Datenschutz durch Technikgestaltung und datenschutzfreundliche Voreinstellungen (Art. 5 und 25) ausgerichtet und unterstützt compliance-orientierte Workflows im Umgang mit sensiblen Textdaten.

❓ Kann Textwash Pro in souveränen oder air-gapped KI-Umgebungen eingesetzt werden?

Ja. Die Bereitstellung für Windows/Linux/macOS läuft vollständig lokal und offline, sodass keine Daten die Client-Umgebung verlassen und keine externe API-Anbindung erforderlich ist.

🚀 Schnellstart-Anleitung

Textwash Pro bietet eine grafische Benutzeroberfläche (GUI) zur Anonymisierung von Textdateien – ganz ohne Kommandozeile:

  • Öffnen Sie die Textwash-Pro-App auf Ihrem Mac-, Windows-, Linux-, iOS- oder Android-Gerät
  • Importieren Sie Daten durch Auswahl einzelner Dateien oder Ordner in der GUI
  • Wählen Sie die Sprache (unterstützt Englisch, Niederländisch, Französisch, Spanisch, Deutsch, Italienisch und viele weitere)
  • Wählen Sie den Ausgabeordner, in dem anonymisierte Dateien gespeichert werden sollen
  • Starten Sie den Anonymisierungslauf; anonymisierte Dateien werden im gewählten Verzeichnis gespeichert

Textwash Pro ist benutzerfreundlich gestaltet und eignet sich sowohl für kleine als auch für große Textsammlungen. Die Anwendung kann leistungsfähige Hardware nutzen, wo verfügbar, erfordert aber keine technische Einrichtung.

Sie möchten eine Vorführung?

Wenn Sie eine kurze Vorführung wünschen oder konkrete Fragen zu Ihrem Anwendungsfall haben, helfen wir Ihnen gerne weiter.

Beispiele & Beispieldaten

Auch das ursprüngliche quelloffene Projekt Textwash enthält detaillierte Personenbeschreibungen und deren anonymisierte Gegenstücke. Diese Beispiele zeigen, wie sich die zugrunde liegende Anonymisierung verhält.

  • Originale, detailreiche Beschreibungen im Verzeichnis examples
  • Entsprechende anonymisierte Versionen im Verzeichnis examples_anonymised

Sie können diese Beispieldateien nutzen, um zu verstehen, wie verschiedene Entitätstypen behandelt werden, und als Ausgangspunkt für Ihre eigene Evaluation.

Textwash Free auf GitHub ansehen

🏷️ Granulare Kontrolle über Entitätstypen

Textwash kann eine breite Palette von Entitätstypen anonymisieren und bei Bedarf auf Teilmengen beschränkt werden.

So können Sie die Anonymisierung an rechtliche und methodische Anforderungen anpassen und gleichzeitig möglichst viele nicht-identifizierende Informationen erhalten.

PRONOMEN TELEFONNUMMER E-MAIL-ADRESSE ZAHLEN MONATE DATUM PERSON ORT BERUF TITEL ALTER KULTURELLE IDENTITÄT UHRZEIT ADRESSE ORGANISATION ANDERES IDENTIFIZIERBARES MERKMAL

Indem Sie nur die benötigten Entitätstypen auswählen, passen Sie die Anonymisierung an Ihren Kontext an und behalten gleichzeitig möglichst viele nützliche, nicht-identifizierende Informationen.

Informationen für Forschende

Textwash Pro ist ein kommerzielles Produkt auf einer forschungsgetriebenen und offen dokumentierten Grundlage. Unabhängig davon, ob Sie Textwash Pro oder einen anderen Anbieter wählen, empfehlen wir, Nachweise für reale Datenschutzversprechen einzufordern.

  • Eine empirische Evaluation, die zeigt, was ein Werkzeug anonymisieren kann und was nicht – idealerweise anhand gemeinsamer Benchmark-Datensätze
  • Eine klare Erklärung der Datenflüsse, einschließlich der Gründe für entfernte APIs und der geltenden Schutzmaßnahmen
  • Governance-Artefakte wie Validierungsberichte, Audit-Nachweise und dokumentierte Grenzen der Methode

Wenn diese Materialien nicht verfügbar sind, sollten Entscheidungsträger Einsatzversprechen mit Vorsicht bewerten und formale Klarstellungen anfordern.

🔬 Technische Berichte

🛡️ Datenschutz im Vergleich

Unabhängige Benchmark-Arbeiten vergleichen Textwash mit mehreren Anonymisierungsansätzen. Die Ergebnisse zeigen, dass Textwash im Datenschutzvergleich klar wettbewerbsfähig und belastbar eingeordnet wird

⚖️ Fokus auf Trade-offs statt Einzelmetrik

Studien diskutieren den Utility/Privacy-Trade-off (z. B. BLEU, Re-Identifikationsrisiko und Rechenkosten) und unterstützen damit eine praxisnahe Werkzeugauswahl entlang realer Anforderungen

📚 Evidenz über Publikationen

Die Evidenz ist über arXiv, peer-reviewte Journals und Konferenzbeiträge zugänglich – hilfreich für Beschaffung, Governance und interne Dokumentation


Für Forschungskooperationen, Interoperabilitätsfragen oder Evaluationsrückfragen kontaktieren Sie textwash-pro@jocapps.eu

🤝 Textwash Pro Partner werden

Sie suchen einen Anonymisierungspartner für Ihr Produkt, Ihre Organisation oder ein Forschungsprojekt? Sprechen wir über Integrationen, Pilotphasen und individuelle Deployments.

✉️ E-Mail schreiben

👥 Wer hat Textwash Pro entwickelt?

Textwash Pro wird entwickelt und vertrieben von Dr. Bennett Kleinberg & jocapps® GmbH und basiert auf Textwash (github.com/ben-aaron188/textwash) unter der GNU General Public License v3.0. Das ursprüngliche Textwash-Projekt wurde entwickelt von Dr. Maximilian Mozes und Dr. Bennett Kleinberg.

Textwash Pro erweitert diese Grundlage um eine plattformübergreifende GUI, Bereitstellungsoptionen und zusätzliche Werkzeuge, während das offene, forschungsgetriebene Ethos des Originalprojekts erhalten bleibt.