3-Stufen-
Architektur.
AES-256 verschlüsselt.
API-first.

Algorithmische Erkennung

Spezialisierte Sprachmodelle

Isolierte Container mit Kundentrennung

Aufbau

Das System verarbeitet Dokumente im Arbeitsspeicher. Originale werden nicht gespeichert. Nach der Anonymisierung existieren nur Hash-Zuordnungen für die spätere Wiederherstellung.

Dokumenteneingang

API oder Web

Verarbeitung

Isolierte Container

Hash-Speicher

Mit Kundentrennung

Ausgabe

Anonymisiert

Erkennungsverfahren

Musterbasierte Erkennung

Reguläre Ausdrücke und Algorithmen identifizieren strukturierte Daten:

  • +Telefonnummern, E-Mail-Adressen
  • +IBAN, Steuernummern
  • +Datumsformate, Postleitzahlen

Kompaktes Sprachmodell

Ein fein abgestimmtes Modell erkennt:

  • +Namen in verschiedenen Kontexten
  • +Unstrukturierte Personenbezüge
  • +Indirekte Identifikatoren

Kontextmodell

Das größere Modell prüft das Gesamtdokument:

  • +Validierung der bisherigen Erkennungen
  • +Kontextuelle Zusammenhänge
  • +Versteckte Referenzen

Verschlüsselung

  • AES-256 für gespeicherte Hash-Paare
  • TLS 1.3 für Übertragungen

Datentrennung

  • Kunde A kann nicht auf Daten von Kunde B zugreifen
  • Separate Verschlüsselungsschlüssel
  • API-Key-basierte Authentifizierung

Löschfristen

  • Konfigurierbar von 24 Stunden bis unbegrenzt
  • Automatische Löschung nach Ablauf
Verschlüsselung, Datentrennung und Löschfristen

Dokumentenverarbeitung

Große Dokumente

Dokumente werden in Abschnitte aufgeteilt (Chunks). Jeder Abschnitt wird einzeln verarbeitet. Das Kontextmodell betrachtet trotzdem das gesamte Dokument.

Unterstützte Formate

  • PDF (auch gescannt)
  • Word, Excel
  • Bilder (JPG, PNG)
  • Reiner Text

Fehlerbehandlung

Bei Verarbeitungsfehlern erhältst du eine detaillierte Fehlermeldung. Teilweise verarbeitete Dokumente werden verworfen.

Technische Grundlagen

Wir nutzen etablierte Komponenten:

  • Moderne Sprachmodelle (fein abgestimmt für Datenschutz)
  • Standard-OCR für Texterkennung
  • Bewährte Verschlüsselungsverfahren

Die Einzigartigkeit entsteht durch:

  • Spezifisches Training der Modelle
  • Kombination der drei Erkennungsstufen
  • Integration mit LLM-Instruktionen

API

Integration

Die API verwendet JSON über HTTPS mit Bearer Token Authentifizierung.

Detaillierte Dokumentation und Endpunkte finden Sie in unserer API-Dokumentation.

Features

  • Synchrone und asynchrone Verarbeitung
  • Webhook-Benachrichtigungen
  • Fair Use Rate Limiting
  • Umfassende Fehlerbehandlung

Jetzt starten.
14 Tage kostenlos testen.

Alle Modelle. Alle Features. Keine Kreditkarte.

Die anymize Beta ist jetzt live. Starte sofort mit 14 Tagen kostenlosem Zugang. Voller Funktionsumfang, keine Einschränkungen. Beta-Nutzer erhalten weiterhin direkten Kontakt zum Entwicklerteam.

Dein KI-Arbeitsplatz wartet.