Question 1

Welche Sprachen werden unterstützt?

Accepted Answer

Dreizehn Sprachen: Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch, Niederländisch, Russisch, Arabisch, Hindi, Chinesisch, Japanisch, Koreanisch. Gemischt-sprachige Meetings (etwa Deutsch/Englisch im Wechsel) werden erkannt, ohne dass du manuell umschalten musst.

Question 2

Wo läuft die Spracherkennung – in den USA oder in Deutschland?

Accepted Answer

Vollständig in unserer Infrastruktur in Deutschland. Wir nutzen das offene Voxtral Transcribe 2-Modell des europäischen Anbieters Mistral, betreiben es aber selbst – kein Audio-Stream und kein Transkript gehen an US-Dienste wie Otter.ai oder Rev. Das ist der entscheidende Unterschied zu den meisten Transkriptionsdiensten am Markt.

Question 3

Wie viele Sprecher können erkannt werden?

Accepted Answer

Es gibt keine feste Obergrenze. Das Modell unterscheidet so viele Sprecher, wie stimmlich differenzierbar sind – von 1:1-Gesprächen bis zu Runden mit 10+ Teilnehmern. Schwieriger wird es bei Hintergrundrauschen oder sehr ähnlichen Stimmen; qualitativ gute Mikrofone helfen.

Question 4

Kann ich den Sprechern nachträglich Namen geben?

Accepted Answer

Ja. Nach Abschluss der Transkription werden Sprecher zunächst als „Sprecher 1“, „Sprecher 2“ etc. gelabelt. Du benennst sie einmal oben im Transkript um – der neue Name wird automatisch durchgängig im gesamten Dokument übernommen. Ein Edit, vollständige Propagation.

Question 5

Warum erfolgt die Sprecher-Erkennung erst nach Abschluss und nicht live?

Accepted Answer

Weil die Erkennung deutlich präziser wird, wenn das Modell das vollständige Gespräch analysiert. Eine Stimme prägt sich mit vielen Sprach-Samples besser ein als mit drei Anfangssätzen. Deshalb läuft die Erkennung einmal am Ende – mit merklich besseren Ergebnissen als jede Live-Variante liefern könnte.

Question 6

Wie funktioniert die Aufnahme mit dem Smartphone?

Accepted Answer

anymize zeigt dir einen QR-Code auf dem Desktop. Scannst du ihn mit dem Handy, öffnet sich die Aufnahme-Oberfläche im Mobile-Browser – derselbe Funktionsumfang wie auf dem Desktop. Du nimmst mit dem Handy auf, das Transkript erscheint parallel auf beiden Geräten. Kein App-Download, kein zusätzlicher Account.

Question 7

Wird das Transkript automatisch anonymisiert?

Accepted Answer

Nur wenn du das möchtest. Aktivierst du die Option, läuft das fertige Transkript einmal durch die anymize-Anonymisierungs-Pipeline. Namen, Adressen, Aktenzeichen und weitere Kategorien werden durch Platzhalter ersetzt – das Transkript kann dann bedenkenlos an internationale Frontier-Modelle weitergegeben werden. Wenn du keine Anonymisierung brauchst (z. B. bei öffentlichen Vorlesungen), lässt du den Schritt weg.

Question 8

Was passiert mit dem Transkript nach der Aufnahme?

Accepted Answer

Es liegt als Dokument in deinem anymize-Konto – genauso wie jedes hochgeladene PDF oder Word-Dokument. Ab da ist es universell nutzbar: als Kontext in Chats, als Eintrag in Wissensdatenbanken, als Dokument in Projekten, als Grundlage für Artefakte (Zusammenfassung, Entlassbrief, Meeting-Protokoll). Natürlich kannst du es auch exportieren.

Question 9

Ist die Live-Transkription auch als Alternative zu Otter.ai geeignet?

Accepted Answer

Ja, mit zwei wesentlichen Unterschieden: Erstens läuft sie in Deutschland, selbst-gehostet – Otter.ai verarbeitet in den USA. Zweitens sitzt sie in einem integrierten KI-Arbeitsplatz: Transkript, Zusammenfassung, Wissensdatenbank und Chat sind eine einzige Plattform. Bei Otter brauchst du zusätzliche Tools für alles jenseits des reinen Transkripts.

Question 10

Wie gehe ich mit § 203 StGB-sensiblen Gesprächen um (Mandatstermin, Patientenvisite)?

Accepted Answer

Zwei Absicherungen: (1) Die Verarbeitung läuft in unserer deutschen Infrastruktur, der AVV greift automatisch, für Rechtsanwälte die BRAO-Einverständniserklärung. (2) Optional kannst du das Transkript anonymisieren lassen – damit verlassen keine identifizierbaren Informationen die Plattform, auch wenn du das Transkript später an internationale Modelle zur Analyse weitergibst. Für Compliance-kritische Umgebungen empfehlen wir den Einsatz unserer eigenen Modelle Waterfall/Fountain für die Nachbearbeitung – dann bleibt wirklich alles in Deutschland.

Einsatz	Was du bekommst	Besonderheit
Mandatstermin (Anwalt)	Vollständiges Gesprächsprotokoll mit Sprecher-Zuordnung Mandant / Kanzlei	Anonymisiert für Peer-Review, Original für die Akte
Patientenvisite (Klinik)	Transkript mit Sprecher-Zuordnung Arzt / Patient / Pflege	Direkt als Quelle für den Entlassbrief, § 203 StGB gewahrt
Team-Meeting (Agentur / Beratung)	Protokoll mit allen To-dos und Entscheidungen, pro Teilnehmer gelabelt	Highlights in einem Artefakt für nicht-anwesende Kollegen
Kunden-Call (Sales / CS)	Gesprächs-Transkript mit Bezug zum CRM-Kontakt	Extraktion von Einwänden, Zusagen, nächsten Schritten
Experten-Interview (Recherche)	Wortgetreues Transkript, Sprecher klar getrennt	Weiterverarbeitung als zitierbare Quelle in Research-Projekten
Vorlesung / Webinar	Volltext-Skript zur Nachbereitung	Erzeugung von Zusammenfassungen, Lernkarten, Glossaren

Aus jedem Gespräch
ein Protokoll.

Drei Ergebnisse.
Ein Arbeitsgang.

Live-Text während du sprichst

Sprecher-Erkennung nach Abschluss

Bearbeitbares Protokoll als Dokument

Zwei Wege,
einzusteigen.

Desktop-Mikrofon

Smartphone via QR-Code

Selbst gehostet.
In 13 Sprachen.

Voxtral Transcribe 2

Deutsche Infrastruktur

Multilingual

Wer hat was gesagt.
Präzise nachvollziehbar.

Keine Begrenzung der Anzahl

Namen nachträglich zuweisen

Warum erst nach Abschluss

Anonymisierung
auf Wunsch.

Auf Wunsch anonymisiert

Originaldaten bleiben zugänglich

Oder nicht anonymisieren

Vom Transkript
zum Arbeits-Ergebnis.

Als Kontext in einen Chat einfügen

In eine Wissensdatenbank übernehmen

Mit einem Projekt verknüpfen

Als Artefakt weiterverarbeiten

Wann Live-Transkription
den Unterschied macht.

Was du über Live-Transkription wissen solltest.

Jetzt starten.
14 Tage kostenlos testen.

Aus jedem Gesprächein Protokoll.

Drei Ergebnisse.Ein Arbeitsgang.