Live-Text während du sprichst
Der transkribierte Text erscheint direkt während der Aufnahme – du siehst, was verstanden wurde, kannst korrigieren oder nachbessern, sobald das Meeting pausiert. Keine Wartezeit auf ein Batch-Ergebnis.
Live-Transkription mit Sprecher-Erkennung. DSGVO-konform, in 13 Sprachen.
Starte die Aufnahme, sprich mit Kollegen, Mandanten, Patienten oder dir selbst – anymize transkribiert live, erkennt nach Abschluss die Sprecher und legt das fertige Protokoll als Dokument in deinem Konto ab. Ab da: weiterverwendbar in Chats, Wissensdatenbanken, Projekten. Ohne dass ein Wort an einen US-Dienst geschickt wurde.
Was du bekommst
Der transkribierte Text erscheint direkt während der Aufnahme – du siehst, was verstanden wurde, kannst korrigieren oder nachbessern, sobald das Meeting pausiert. Keine Wartezeit auf ein Batch-Ergebnis.
Sobald du die Aufnahme beendest, läuft die Sprecher-Erkennung über das Gesamt-Transkript. Jede Passage wird dem richtigen Sprecher zugeordnet. Keine Begrenzung der Teilnehmer – zwei Menschen, fünf, zwölf oder mehr, das Modell erkennt so viele Stimmen, wie unterscheidbar sind.
Das fertige Transkript liegt als Dokument in anymize bereit – genau wie jedes hochgeladene PDF. Damit wird es zum Baustein deines weiteren Workflows: einfügen in Chats, hinzufügen zu Wissensdatenbanken, verknüpfen mit Projekten, zusammenfassen als Artefakt.
So funktioniert's
Standard-Weg für das Büro. Wähle dein Mikrofon aus dem Dropdown, klick „Aufnahme starten“ – ab jetzt wird transkribiert. Pause-Button für Unterbrechungen, Stop-Button beendet die Session und startet die Sprecher-Erkennung.
Perfekt für Meeting-Räume, Visite am Krankenbett, Interview beim Kunden vor Ort. anymize zeigt dir einen QR-Code auf dem Desktop – scannst du ihn mit dem Handy, öffnet sich dieselbe Aufnahme-Oberfläche im Mobile-Browser. Du nimmst mit dem Handy auf, das Transkript erscheint parallel auf beiden Geräten. Kein App-Download, kein Account-Wechsel, keine separate Aufzeichnungssoftware.
Besprechung im Konferenzraum, Laptop nicht greifbar oder zu laut im Lüfter. Handy hervor, QR scannen, Aufnahme läuft. Zurück am Schreibtisch hast du das fertige Transkript in deinem anymize-Konto bereit.
Der Sprachstack
Die Spracherkennung basiert auf Voxtral Transcribe 2 – dem offenen Sprach-Modell von Mistral, einem europäischen Anbieter. Wir betreiben es selbst in unserer Infrastruktur: kein Audio-Stream geht an US-Dienste wie Otter.ai oder Rev, kein Transkript landet bei einem Drittanbieter.
Gemischt-sprachige Meetings (z. B. DE + EN im Wechsel) werden erkannt, ohne dass du manuell umschalten musst.
Offenes Modell von Mistral, selbst betrieben.
Kein Routing zu Otter.ai, Rev oder anderen US-Anbietern.
Sprachen-Wechsel im gleichen Meeting ohne manuelle Umstellung.
Warum selbst-gehostet
Sprachaufnahmen gehören zu den sensibelsten Dokumenten eines Unternehmens: Mandantenbesprechungen, Patientenvisiten, Investorengespräche, interne Strategiemeetings. Bei den meisten Transkriptionsdiensten landet das Audio beim Anbieter – oft in den USA, oft mit unklaren Datenschutz-Zusagen. Bei anymize passiert die Verarbeitung ausschließlich in unserer Infrastruktur in Deutschland. Kein Audio, kein Transkript, keine Metadaten gehen an Dritte.
Sprecher-Erkennung
Nach Abschluss der Aufnahme läuft die Sprecher-Erkennung einmal über das gesamte Transkript. Das Ergebnis: Jede Passage trägt ein Sprecher-Label – „Sprecher 1“, „Sprecher 2“ und so weiter.
Zwei Personen, fünf, zwölf – das Modell unterscheidet so viele Sprecher, wie es stimmlich differenzieren kann. Ideal für Runden-Meetings, Board-Sitzungen, Konferenzen mit vielen Beteiligten.
Die Labels („Sprecher 1“, „Sprecher 2“) benennst du um – einmal im Transkript oben. Der neue Name wird automatisch durchgängig im gesamten Dokument übernommen. Aus „Sprecher 1“ wird „Dr. Schmidt“, aus „Sprecher 2“ wird „Mandant“ oder „Anna“. Das passiert in einem Schritt, nicht passage-weise.
Sprecher-Trennung wird deutlich präziser, wenn das Modell das vollständige Gespräch analysieren kann. Einzelne Stimmen prägen sich durch viele Samples besser ein als durch die ersten drei Sätze. Deshalb läuft die Erkennung einmal am Ende – mit deutlich besseren Ergebnissen als eine Live-Erkennung während der Aufnahme liefern könnte.
Anonymisierung
Transkripte enthalten typischerweise viele personenbezogene Daten: Namen von Beteiligten, Adressen, Telefonnummern, Krankheitsbilder, Firmenbezüge. Ob diese im Klartext oder als Platzhalter im Dokument stehen, entscheidest du.
Aktivierst du die Anonymisierung, läuft das fertige Transkript nach Aufnahmeende einmal durch die anymize-Anonymisierungs-Pipeline: Namen, Adressen, IBAN, Aktenzeichen und die übrigen 40+ Kategorien werden zu Platzhaltern. Das anonymisierte Transkript ist dann bedenkenlos an internationale Frontier-Modelle weiterreichbar (für Zusammenfassung, Analyse, Übersetzung) – ohne dass Beteiligte identifiziert werden können.
Dank der bidirektionalen Anonymisierung sind die Originaldaten weiterhin zugänglich: In der Vorschau siehst du sie normal. In Chats, die auf dem Transkript basieren, erhältst du Antworten mit den echten Namen zurück. Beim Export entscheidest du pro Datei, ob Originale oder Platzhalter exportiert werden.
Für interne Meetings ohne sensible Inhalte oder für Audio aus öffentlichen Quellen (Vorlesungen, Podcasts) lässt du die Anonymisierung weg – spart Verarbeitungsschritte, das Transkript bleibt im Klartext.
Weiterverwenden
Ein fertiges Transkript ist selten das Endprodukt. Du willst eine Zusammenfassung, eine To-do-Liste, eine Anonymisierung für den Versand, eine Struktur für die Ablage. In anymize geht das ohne Medienbruch:
Starte einen Chat, verweise auf das Transkript-Dokument. Die KI liest es ein und du fragst: „Fasse die Kernentscheidungen in 5 Punkten zusammen.“ · „Extrahiere alle To-dos mit Zuordnung zum Verantwortlichen.“ · „Was hat Dr. Schmidt zum Thema X gesagt?“
Für wiederkehrende Themen (Wochen-Jour-fixe, Mandanten-Termine, Klinik-Visiten) lege eine Wissensdatenbank an und sammle dort alle relevanten Transkripte. Die KI greift darauf zu, sobald du später Fragen stellst – mit Quellenangabe.
WissensdatenbankenGehört das Transkript zu einem laufenden Mandat, Beratungsprojekt oder Produkt-Launch? Verknüpfe es mit dem passenden Projekt. Alle Teilnehmer des Projekts haben das Transkript ab jetzt als Kontext – ohne dass du es manuell teilen musst.
ProjekteLass die KI aus dem Transkript ein fertiges Artefakt erzeugen: ein formaler Sitzungsbericht, ein Entscheidungs-Protokoll, eine To-do-Liste als Tabelle, eine Mandanteninformation als Brief. Editier im WYSIWYG-Editor, exportier als Word oder PDF.
ArtefakteEinsatzgebiete
Sechs realistische Einsätze – aus echten Arbeitsrealitäten unserer Kunden:
Vollständiges Gesprächsprotokoll mit Sprecher-Zuordnung Mandant / Kanzlei
Anonymisiert für Peer-Review, Original für die Akte
Transkript mit Sprecher-Zuordnung Arzt / Patient / Pflege
Direkt als Quelle für den Entlassbrief, § 203 StGB gewahrt
Protokoll mit allen To-dos und Entscheidungen, pro Teilnehmer gelabelt
Highlights in einem Artefakt für nicht-anwesende Kollegen
Gesprächs-Transkript mit Bezug zum CRM-Kontakt
Extraktion von Einwänden, Zusagen, nächsten Schritten
Wortgetreues Transkript, Sprecher klar getrennt
Weiterverarbeitung als zitierbare Quelle in Research-Projekten
Volltext-Skript zur Nachbereitung
Erzeugung von Zusammenfassungen, Lernkarten, Glossaren
Überall dort, wo eine Nachbearbeitung nötig ist – Sitzungsbericht, Entlassbrief, Fall-Notiz, Meeting-Summary – spart Live-Transkription plus KI-Nachverarbeitung die Hauptarbeit: das manuelle Abtippen und Strukturieren.
Häufige Fragen
Dreizehn Sprachen: Deutsch, Englisch, Französisch, Italienisch, Spanisch, Portugiesisch, Niederländisch, Russisch, Arabisch, Hindi, Chinesisch, Japanisch, Koreanisch. Gemischt-sprachige Meetings (etwa Deutsch/Englisch im Wechsel) werden erkannt, ohne dass du manuell umschalten musst.
Alle Modelle. Alle Features. Keine Kreditkarte.
Wir sind überzeugt von anymize. Und wir wissen: Bei einem KI-Werkzeug, das Mandanten-, Patienten- oder Mitarbeiter-Daten berührt, reicht ein Demo-Video nicht. Deshalb 14 Tage voller Zugang – alle Modelle, alle Features, keine Kreditkarte. Genug Zeit, um sicher zu sein, bevor du uns vertraust.
Dein KI-Arbeitsplatz wartet.