Neue KI-Transkriptionsmodelle: Schnell, datensicher — und mit überraschenden Möglichkeiten
- Startseite
- Technologie
- Neue KI-Transkriptionsmodelle: Schnell, datensicher — und mit überraschenden Möglichkeiten
- Last update: vor 3 Stunden
- 3 Min. Lesezeit
- 820 Aufrufe
- Technologie
Bei der Umwandlung gesprochener Sprache in Text spielt der Schutz vertraulicher Informationen eine entscheidende Rolle. Dies gilt insbesondere für Inhalte aus sensiblen Bereichen wie medizinischen Konsultationen, rechtlichen Gesprächen oder nicht öffentlichen Interviews. In solchen Fällen besteht ein erhöhtes Risiko, wenn Audiodaten zur Verarbeitung an externe Server übertragen werden. Um diese Risiken zu vermeiden, rücken Lösungen in den Vordergrund, die direkt auf dem jeweiligen Endgerät betrieben werden können und keine permanente Internetverbindung benötigen.
Vor diesem Hintergrund hat das französische Unternehmen Mistral AI neue Modelle zur automatisierten Transkription vorgestellt. Diese wurden so entwickelt, dass sie aufgrund ihrer kompakten Struktur lokal eingesetzt werden können. Die Nutzung ist auf unterschiedlichen Plattformen möglich, darunter Smartphones, Laptops sowie cloudbasierte Umgebungen. Ziel der Entwicklung ist es, Anwendern eine bessere Kontrolle über ihre Daten zu geben und gleichzeitig eine sehr schnelle Verarbeitung von Audiosignalen zu gewährleisten.
Zu den neuen Lösungen zählt das Modell Voxtral Mini Transcribe 2. Nach Angaben von Pierre Stock, der bei Mistral AI als Vizepräsident für wissenschaftliche Abläufe tätig ist, wurde dieses Modell bewusst sehr klein gehalten, ohne dabei auf Leistungsfähigkeit zu verzichten. Ergänzend dazu wurde das Modell Voxtral Realtime vorgestellt, das speziell für Transkriptionen in Echtzeit konzipiert ist und damit eine ähnliche Funktion erfüllt wie Live-Untertitel bei Übertragungen.
Die lokale Verarbeitung der Audiodaten bringt mehrere Vorteile mit sich. Zum einen erhöht sie die Datensicherheit, da sensible Inhalte das Gerät nicht verlassen müssen. Zum anderen werden Verzögerungen reduziert, da der zeitaufwendige Transfer von Audiodateien an entfernte Rechenzentren entfällt. Die Umwandlung von Sprache in Text erfolgt unmittelbar dort, wo die Aufnahme entsteht, beispielsweise auf einem Laptop, einem Smartphone oder auch auf tragbaren Geräten wie Smartwatches.
Gerade bei Anwendungen in Echtzeit ist eine sehr geringe Latenz von zentraler Bedeutung. Mistral AI gibt an, dass Voxtral Realtime eine Verzögerung von weniger als 200 Millisekunden erreicht. Dadurch werden gesprochene Inhalte nahezu synchron in Textform dargestellt und die sonst häufig auftretenden Verzögerungen von mehreren Sekunden vermieden.
Voxtral Realtime wird über die Programmierschnittstelle von Mistral AI sowie über die Plattform Hugging Face angeboten. Dort steht auch eine Demonstrationsumgebung zur Verfügung, mit der sich die Funktionsweise testen lässt. Nach Unternehmensangaben unterstützt das Modell aktuell 13 verschiedene Sprachen.
Auch Voxtral Mini Transcribe 2 ist über die API von Mistral AI verfügbar und kann zusätzlich im firmeneigenen AI Studio genutzt werden. In Tests erwies sich das Modell als schnell und zuverlässig, wobei es vereinzelt zu Ungenauigkeiten bei Eigennamen kam. Mistral AI weist darauf hin, dass solche Schwächen durch gezielte Anpassungen reduziert werden können, indem das Modell auf spezifische Begriffe, Namen oder Fachterminologie trainiert wird.
Die Entwicklung besonders kleiner und zugleich leistungsfähiger KI-Modelle stellt laut Pierre Stock eine anspruchsvolle Aufgabe dar. Neben der kompakten Größe und der hohen Verarbeitungsgeschwindigkeit müsse auch die Genauigkeit stimmen. In diesem Zusammenhang verweist Mistral AI auf Benchmark-Ergebnisse, die im Vergleich zu anderen Lösungen geringere Fehlerraten zeigen. Nach Einschätzung des Unternehmens genügt es nicht, Modelle lediglich zu verkleinern. Entscheidend sei vielmehr, dass kompakte Systeme eine Qualität erreichen, die mit deutlich größeren Modellen vergleichbar ist.
Author:
Jon Reed
Share This News
„Pokémon, Ken-ergy und weitere Super Bowl 2026-Werbespots, die du jetzt schon sehen kannst“
Die ersten Werbespots zum Super Bowl 2026 sind da und zeigen eine bunte Mischung aus Humor, Nostalgie und moderner Technologie. Marken wie Pokémon, Ken, Pepsi und Svedka setzen auf kreative Ideen, Kün...
vor 2 Stunden 3 Min. Lesezeit Technologie Kourtnee Jackson
Neue KI-Transkriptionsmodelle: Schnell, datensicher — und mit überraschenden Möglichkeiten
Mistral AI hat neue Transkriptionsmodelle entwickelt, die lokal auf Endgeräten wie Smartphones oder Laptops laufen. Diese Modelle bieten nicht nur schnellen, datensicheren Service, sondern auch eine E...
vor 3 Stunden 3 Min. Lesezeit Technologie Jon Reed
KI als stiller Helfer: Wie moderne Technologie die Haustierpflege verändert
Moderne Technologie verändert die Art und Weise, wie wir uns um unsere Haustiere kümmern. Künstliche Intelligenz hilft dabei, das Verhalten unserer Tiere besser zu verstehen und individuell zugeschnit...
vor 3 Stunden 4 Min. Lesezeit Technologie Rachel Kane
Das Verborgene „Knopf“ auf der Rückseite deines iPhones – und es ist unglaublich nützlich!
Auf der Rueckseite vieler iPhones versteckt sich ein wenig bekannter Knopf, der erstaunlich praktisch ist. Mit der „Back Tap“-Funktion lassen sich durch Doppeltippen oder Dreifachtippen Apps oeder Fun...
vor 3 Stunden 4 Min. Lesezeit Technologie Jason Chun
AT&T präsentiert Turbo Live: Neue Lösung для бесперебойной связи на Супербоуле
ATandT startet Turbo Live, einen neuen Dienst, der Besuchern grosser Sportveranstaltungen wie dem Super Bowl stabile Mobilfunkverbindungen bietet. Mit priorisiertem Netzzugang sollen ueberlastete Hand...
vor 4 Stunden 3 Min. Lesezeit Technologie Jeff Carlson
So kannst du Peacock Premium kostenlos bekommen – все способы!
Peacock bietet verschiedene Möglichkeiten, ein kostenloses Premium-Abonnement zu erhalten. Nutzer von Instacart Plus, Xfinity-Kunden mit bestimmten Tarifen oder Spectrum TV Select können ohne zusätzli...
vor 4 Stunden 4 Min. Lesezeit Technologie Kourtnee Jackson
Rätselhafte Hinweise und überraschende Lösungen: NYT-Ausgabe vom 5. Februar #704 enthüllt mehr als erwartet
Die Ausgabe der New York Times vom 5. Februar 2026 präsentiert erneut das Strands-Rätsel, das Spieler mit dem Thema „Quint-essential“ herausfordert. Durch das Finden von Wörtern mit mindestens vier Bu...
vor 4 Stunden 2 Min. Lesezeit Technologie Gael Cooper
NYT Connections am 5. Februar: Die verborgenen Hinweise und Lösungen zu Rätsel #970
Das NYT Connections-Puzzle vom 5. Februar 2026 stellt Spieler vor eine Reihe herausfordernder Aufgaben. Die Lösungen und Hinweise für die vier Gruppen des Tages beinhalten kulturelle Symbole der USA, ...
vor 4 Stunden 3 Min. Lesezeit Technologie Gael Cooper
Geheimtipp für das Wordle-Rätsel vom 5. Februar: Hinweise und Lösung für #1692
Das Wordle-Raetsel vom 5. Februar stellt Spieler vor eine spannende Aufgabe. Mit nur einem Vokal, der zweimal vorkommt, beginnt das gesuchte Wort mit S und endet mit P. Wer die Hinweise geschickt komb...
vor 4 Stunden 3 Min. Lesezeit Technologie Gael Cooper
"Termine für das Eiskunstlaufen bei den Olympischen Winterspielen 2026: Wann es spannend wird"
Die Olympischen Winterspiele 2026 in Mailand-Cortina versprechen spannende Eiskunstlauf-Wettbewerbe. Vom 6. bis 21. Februar kämpfen weltbeste Athleten um Medaillen. Besonders die Team-Wettbewerbe und ...
vor 8 Stunden 4 Min. Lesezeit Technologie Kevin Lynch