Question 1

Welche Sprachen werden unterstützt?

Accepted Answer

Dreizehn Sprachen: Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch, Niederländisch, Russisch, Arabisch, Hindi, Chinesisch, Japanisch, Koreanisch. Gemischt-sprachige Meetings (etwa Deutsch/Englisch im Wechsel) werden erkannt, ohne dass du manuell umschalten musst.

Question 2

Wo läuft die Spracherkennung – in den USA oder in Deutschland?

Accepted Answer

Vollständig in unserer Infrastruktur in Deutschland. Wir nutzen das offene Voxtral Transcribe 2-Modell des europäischen Anbieters Mistral, betreiben es aber selbst – kein Audio-Stream und kein Transkript gehen an US-Dienste wie Otter.ai oder Rev. Das ist der entscheidende Unterschied zu den meisten Transkriptionsdiensten am Markt.

Question 3

Wie viele Sprecher können erkannt werden?

Accepted Answer

Es gibt keine feste Obergrenze. Das Modell unterscheidet so viele Sprecher, wie stimmlich differenzierbar sind – von 1:1-Gesprächen bis zu Runden mit 10+ Teilnehmern. Schwieriger wird es bei Hintergrundrauschen oder sehr ähnlichen Stimmen; qualitativ gute Mikrofone helfen.

Question 4

Kann ich den Sprechern nachträglich Namen geben?

Accepted Answer

Ja. Nach Abschluss der Transkription werden Sprecher zunächst als „Sprecher 1“, „Sprecher 2“ etc. gelabelt. Du benennst sie einmal oben im Transkript um – der neue Name wird automatisch durchgängig im gesamten Dokument übernommen. Ein Edit, vollständige Propagation.

Question 5

Warum erfolgt die Sprecher-Erkennung erst nach Abschluss und nicht live?

Accepted Answer

Weil die Erkennung deutlich präziser wird, wenn das Modell das vollständige Gespräch analysiert. Eine Stimme prägt sich mit vielen Sprach-Samples besser ein als mit drei Anfangssätzen. Deshalb läuft die Erkennung einmal am Ende – mit merklich besseren Ergebnissen als jede Live-Variante liefern könnte.

Question 6

Wie funktioniert die Aufnahme mit dem Smartphone?

Accepted Answer

anymize zeigt dir einen QR-Code auf dem Desktop. Scannst du ihn mit dem Handy, öffnet sich die Aufnahme-Oberfläche im Mobile-Browser – derselbe Funktionsumfang wie auf dem Desktop. Du nimmst mit dem Handy auf, das Transkript erscheint parallel auf beiden Geräten. Kein App-Download, kein zusätzlicher Account.

Question 7

Wird das Transkript automatisch anonymisiert?

Accepted Answer

Nur wenn du das möchtest. Aktivierst du die Option, läuft das fertige Transkript einmal durch die anymize-Anonymisierungs-Pipeline. Namen, Adressen, Aktenzeichen und weitere Kategorien werden durch Platzhalter ersetzt – das Transkript kann dann bedenkenlos an internationale Frontier-Modelle weitergegeben werden. Wenn du keine Anonymisierung brauchst (z. B. bei öffentlichen Vorlesungen), lässt du den Schritt weg.

Question 8

Was passiert mit dem Transkript nach der Aufnahme?

Accepted Answer

Es liegt als Dokument in deinem anymize-Konto – genauso wie jedes hochgeladene PDF oder Word-Dokument. Ab da ist es universell nutzbar: als Kontext in Chats, als Eintrag in Wissensdatenbanken, als Dokument in Projekten, als Grundlage für Artefakte (Zusammenfassung, Entlassbrief, Meeting-Protokoll). Natürlich kannst du es auch exportieren.

Question 9

Ist die Live-Transkription auch als Alternative zu Otter.ai geeignet?

Accepted Answer

Ja, mit zwei wesentlichen Unterschieden: Erstens läuft sie in Deutschland, selbst-gehostet – Otter.ai verarbeitet in den USA. Zweitens sitzt sie in einem integrierten KI-Arbeitsplatz: Transkript, Zusammenfassung, Wissensdatenbank und Chat sind eine einzige Plattform. Bei Otter brauchst du zusätzliche Tools für alles jenseits des reinen Transkripts.

Question 10

Wie gehe ich mit § 203 StGB-sensiblen Gesprächen um (Mandatstermin, Patientenvisite)?

Accepted Answer

Zwei Absicherungen: (1) Die Verarbeitung läuft in unserer deutschen Infrastruktur, der AVV greift automatisch, für Rechtsanwälte die BRAO-Einverständniserklärung. (2) Optional kannst du das Transkript anonymisieren lassen – damit verlassen keine identifizierbaren Informationen die Plattform, auch wenn du das Transkript später an internationale Modelle zur Analyse weitergibst. Für Compliance-kritische Umgebungen empfehlen wir den Einsatz unserer eigenen Modelle Waterfall/Fountain für die Nachbearbeitung – dann bleibt wirklich alles in Deutschland.

Setting	What you get	Specifics
Client meeting (lawyer)	Complete conversation protocol with speaker assignment client / firm	Anonymized for peer review, original for the file
Patient rounds (clinic)	Transcript with speaker assignment physician / patient / care	Directly used as a source for the discharge letter, § 203 StGB preserved
Team meeting (agency / consulting)	Protocol with all to-dos and decisions, labeled per participant	Highlights in an artifact for colleagues who did not attend
Customer call (sales / CS)	Conversation transcript with reference to the CRM contact	Extraction of objections, commitments, next steps
Expert interview (research)	Verbatim transcript, speakers clearly separated	Reused as a citable source in research projects
Lecture / webinar	Full-text script for post-processing	Generation of summaries, flashcards, glossaries

Every conversation
becomes a protocol.

Three results.
One working pass.

Live text as you speak

Speaker recognition after the recording

An editable protocol as a document

Two ways
to start.

Desktop microphone

Smartphone via QR code

Self-hosted.
In 13 languages.

Voxtral Transcribe 2

European infrastructure

Multilingual

Who said what.
Precisely traceable.

No participant limit

Assign names afterwards

Why only after the recording

Anonymization
on demand.

Anonymized on demand

Originals stay reachable

Or don't anonymize

From transcript
to finished work.

Drop into a chat as context

Move into a knowledge base

Link with a project

Turn into an artifact

When live transcription
makes the difference.

What you should know about live transcription.

Start now.
14 days free trial.

Every conversationbecomes a protocol.

Three results.One working pass.