Aus jedem Gespräch
ein Protokoll.

Live-Transkription mit Sprecher-Erkennung. DSGVO-konform, in 13 Sprachen.

Starte die Aufnahme, sprich mit Kollegen, Mandanten, Patienten oder dir selbst – anymize transkribiert live, erkennt nach Abschluss die Sprecher und legt das fertige Protokoll als Dokument in deinem Konto ab. Ab da: weiterverwendbar in Chats, Wissensdatenbanken, Projekten. Ohne dass ein Wort an einen US-Dienst geschickt wurde.

Was du bekommst

Drei Ergebnisse.
Ein Arbeitsgang.

01

Live-Text während du sprichst

Der transkribierte Text erscheint direkt während der Aufnahme – du siehst, was verstanden wurde, kannst korrigieren oder nachbessern, sobald das Meeting pausiert. Keine Wartezeit auf ein Batch-Ergebnis.

02

Sprecher-Erkennung nach Abschluss

Sobald du die Aufnahme beendest, läuft die Sprecher-Erkennung über das Gesamt-Transkript. Jede Passage wird dem richtigen Sprecher zugeordnet. Keine Begrenzung der Teilnehmer – zwei Menschen, fünf, zwölf oder mehr, das Modell erkennt so viele Stimmen, wie unterscheidbar sind.

03

Bearbeitbares Protokoll als Dokument

Das fertige Transkript liegt als Dokument in anymize bereit – genau wie jedes hochgeladene PDF. Damit wird es zum Baustein deines weiteren Workflows: einfügen in Chats, hinzufügen zu Wissensdatenbanken, verknüpfen mit Projekten, zusammenfassen als Artefakt.

So funktioniert's

Zwei Wege,
einzusteigen.

Weg 01

Desktop-Mikrofon

Standard-Weg für das Büro. Wähle dein Mikrofon aus dem Dropdown, klick „Aufnahme starten“ – ab jetzt wird transkribiert. Pause-Button für Unterbrechungen, Stop-Button beendet die Session und startet die Sprecher-Erkennung.

Weg 02

Smartphone via QR-Code

Perfekt für Meeting-Räume, Visite am Krankenbett, Interview beim Kunden vor Ort. anymize zeigt dir einen QR-Code auf dem Desktop – scannst du ihn mit dem Handy, öffnet sich dieselbe Aufnahme-Oberfläche im Mobile-Browser. Du nimmst mit dem Handy auf, das Transkript erscheint parallel auf beiden Geräten. Kein App-Download, kein Account-Wechsel, keine separate Aufzeichnungssoftware.

Einsatz-Szenario

Besprechung im Konferenzraum, Laptop nicht greifbar oder zu laut im Lüfter. Handy hervor, QR scannen, Aufnahme läuft. Zurück am Schreibtisch hast du das fertige Transkript in deinem anymize-Konto bereit.

Der Sprachstack

Selbst gehostet.
In 13 Sprachen.

Die Spracherkennung basiert auf Voxtral Transcribe 2 – dem offenen Sprach-Modell von Mistral, einem europäischen Anbieter. Wir betreiben es selbst in unserer Infrastruktur: kein Audio-Stream geht an US-Dienste wie Otter.ai oder Rev, kein Transkript landet bei einem Drittanbieter.

Unterstützte Sprachen
13 Sprachen
  • DEDeutsch
  • ENEnglish
  • FRFrançais
  • ITItaliano
  • ESEspañol
  • PTPortuguês
  • NLNederlands
  • RUРусский
  • ARالعربية
  • HIहिन्दी
  • ZH中文
  • JA日本語
  • KO한국어

Gemischt-sprachige Meetings (z. B. DE + EN im Wechsel) werden erkannt, ohne dass du manuell umschalten musst.

Voxtral Transcribe 2

Offenes Modell von Mistral, selbst betrieben.

Deutsche Infrastruktur

Kein Routing zu Otter.ai, Rev oder anderen US-Anbietern.

Multilingual

Sprachen-Wechsel im gleichen Meeting ohne manuelle Umstellung.

Warum selbst-gehostet

Sprachaufnahmen gehören zu den sensibelsten Dokumenten eines Unternehmens: Mandantenbesprechungen, Patientenvisiten, Investorengespräche, interne Strategiemeetings. Bei den meisten Transkriptionsdiensten landet das Audio beim Anbieter – oft in den USA, oft mit unklaren Datenschutz-Zusagen. Bei anymize passiert die Verarbeitung ausschließlich in unserer Infrastruktur in Deutschland. Kein Audio, kein Transkript, keine Metadaten gehen an Dritte.

Sprecher-Erkennung

Wer hat was gesagt.
Präzise nachvollziehbar.

Nach Abschluss der Aufnahme läuft die Sprecher-Erkennung einmal über das gesamte Transkript. Das Ergebnis: Jede Passage trägt ein Sprecher-Label – „Sprecher 1“, „Sprecher 2“ und so weiter.

Keine Begrenzung der Anzahl

Zwei Personen, fünf, zwölf – das Modell unterscheidet so viele Sprecher, wie es stimmlich differenzieren kann. Ideal für Runden-Meetings, Board-Sitzungen, Konferenzen mit vielen Beteiligten.

Namen nachträglich zuweisen

Die Labels („Sprecher 1“, „Sprecher 2“) benennst du um – einmal im Transkript oben. Der neue Name wird automatisch durchgängig im gesamten Dokument übernommen. Aus „Sprecher 1“ wird „Dr. Schmidt“, aus „Sprecher 2“ wird „Mandant“ oder „Anna“. Das passiert in einem Schritt, nicht passage-weise.

Vor der Zuweisung
Sprecher 1
Sprecher 2
Nach einem Klick
Dr. Schmidt
Mandant
Propagation im gesamten Dokument

Warum erst nach Abschluss

Sprecher-Trennung wird deutlich präziser, wenn das Modell das vollständige Gespräch analysieren kann. Einzelne Stimmen prägen sich durch viele Samples besser ein als durch die ersten drei Sätze. Deshalb läuft die Erkennung einmal am Ende – mit deutlich besseren Ergebnissen als eine Live-Erkennung während der Aufnahme liefern könnte.

Anonymisierung

Anonymisierung
auf Wunsch.

Transkripte enthalten typischerweise viele personenbezogene Daten: Namen von Beteiligten, Adressen, Telefonnummern, Krankheitsbilder, Firmenbezüge. Ob diese im Klartext oder als Platzhalter im Dokument stehen, entscheidest du.

Anonymisierungaktiviert

Auf Wunsch anonymisiert

Aktivierst du die Anonymisierung, läuft das fertige Transkript nach Aufnahmeende einmal durch die anymize-Anonymisierungs-Pipeline: Namen, Adressen, IBAN, Aktenzeichen und die übrigen 40+ Kategorien werden zu Platzhaltern. Das anonymisierte Transkript ist dann bedenkenlos an internationale Frontier-Modelle weiterreichbar (für Zusammenfassung, Analyse, Übersetzung) – ohne dass Beteiligte identifiziert werden können.

Originaldaten bleiben zugänglich

Dank der bidirektionalen Anonymisierung sind die Originaldaten weiterhin zugänglich: In der Vorschau siehst du sie normal. In Chats, die auf dem Transkript basieren, erhältst du Antworten mit den echten Namen zurück. Beim Export entscheidest du pro Datei, ob Originale oder Platzhalter exportiert werden.

Oder nicht anonymisieren

Für interne Meetings ohne sensible Inhalte oder für Audio aus öffentlichen Quellen (Vorlesungen, Podcasts) lässt du die Anonymisierung weg – spart Verarbeitungsschritte, das Transkript bleibt im Klartext.

Weiterverwenden

Vom Transkript
zum Arbeits-Ergebnis.

Ein fertiges Transkript ist selten das Endprodukt. Du willst eine Zusammenfassung, eine To-do-Liste, eine Anonymisierung für den Versand, eine Struktur für die Ablage. In anymize geht das ohne Medienbruch:

01

Als Kontext in einen Chat einfügen

Starte einen Chat, verweise auf das Transkript-Dokument. Die KI liest es ein und du fragst: „Fasse die Kernentscheidungen in 5 Punkten zusammen.“ · „Extrahiere alle To-dos mit Zuordnung zum Verantwortlichen.“ · „Was hat Dr. Schmidt zum Thema X gesagt?“

02

In eine Wissensdatenbank übernehmen

Für wiederkehrende Themen (Wochen-Jour-fixe, Mandanten-Termine, Klinik-Visiten) lege eine Wissensdatenbank an und sammle dort alle relevanten Transkripte. Die KI greift darauf zu, sobald du später Fragen stellst – mit Quellenangabe.

Wissensdatenbanken
03

Mit einem Projekt verknüpfen

Gehört das Transkript zu einem laufenden Mandat, Beratungsprojekt oder Produkt-Launch? Verknüpfe es mit dem passenden Projekt. Alle Teilnehmer des Projekts haben das Transkript ab jetzt als Kontext – ohne dass du es manuell teilen musst.

Projekte
04

Als Artefakt weiterverarbeiten

Lass die KI aus dem Transkript ein fertiges Artefakt erzeugen: ein formaler Sitzungsbericht, ein Entscheidungs-Protokoll, eine To-do-Liste als Tabelle, eine Mandanteninformation als Brief. Editier im WYSIWYG-Editor, exportier als Word oder PDF.

Artefakte

Einsatzgebiete

Wann Live-Transkription
den Unterschied macht.

Sechs realistische Einsätze – aus echten Arbeitsrealitäten unserer Kunden:

Mandatstermin (Anwalt)
Was du bekommst

Vollständiges Gesprächsprotokoll mit Sprecher-Zuordnung Mandant / Kanzlei

Besonderheit

Anonymisiert für Peer-Review, Original für die Akte

Patientenvisite (Klinik)
Was du bekommst

Transkript mit Sprecher-Zuordnung Arzt / Patient / Pflege

Besonderheit

Direkt als Quelle für den Entlassbrief, § 203 StGB gewahrt

Team-Meeting (Agentur / Beratung)
Was du bekommst

Protokoll mit allen To-dos und Entscheidungen, pro Teilnehmer gelabelt

Besonderheit

Highlights in einem Artefakt für nicht-anwesende Kollegen

Kunden-Call (Sales / CS)
Was du bekommst

Gesprächs-Transkript mit Bezug zum CRM-Kontakt

Besonderheit

Extraktion von Einwänden, Zusagen, nächsten Schritten

Experten-Interview (Recherche)
Was du bekommst

Wortgetreues Transkript, Sprecher klar getrennt

Besonderheit

Weiterverarbeitung als zitierbare Quelle in Research-Projekten

Vorlesung / Webinar
Was du bekommst

Volltext-Skript zur Nachbereitung

Besonderheit

Erzeugung von Zusammenfassungen, Lernkarten, Glossaren

Das Muster

Überall dort, wo eine Nachbearbeitung nötig ist – Sitzungsbericht, Entlassbrief, Fall-Notiz, Meeting-Summary – spart Live-Transkription plus KI-Nachverarbeitung die Hauptarbeit: das manuelle Abtippen und Strukturieren.

Was du über Live-Transkription wissen solltest.

Häufige Fragen

Dreizehn Sprachen: Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch, Niederländisch, Russisch, Arabisch, Hindi, Chinesisch, Japanisch, Koreanisch. Gemischt-sprachige Meetings (etwa Deutsch/Englisch im Wechsel) werden erkannt, ohne dass du manuell umschalten musst.

Jetzt starten.
14 Tage kostenlos testen.

Alle Modelle. Alle Features. Keine Kreditkarte.

Wir sind überzeugt von anymize. Und wir wissen: Bei einem KI-Werkzeug, das Mandanten-, Patienten- oder Mitarbeiter-Daten berührt, reicht ein Demo-Video nicht. Deshalb 14 Tage voller Zugang – alle Modelle, alle Features, keine Kreditkarte. Genug Zeit, um sicher zu sein, bevor du uns vertraust.

Dein KI-Arbeitsplatz wartet.