Meta präsentiert "Voicebox": Neues Text-to-Speech Übersetzungstool
Meta präsentiert präzises, leistungsstarkes, multilinguales Audio-Tool.

Meta hat eine neuartige Künstliche Intelligenz (KI) namens “Voicebox” entwickelt, die Text in Audio umwandeln kann. Im Gegensatz zu gängigen Text-to-Speech-Übersetzungstools bietet Voicebox eine Vielzahl von Sprachstilen und Stimmen an. Das System kann Texteingaben empfangen und diese in verschiedene Sprachen übersetzen, wie in einem Übersichts-Clip von Meta demonstriert wird.

Voicebox bietet mehr als nur ein Übersetzungstool

Das Technologieunternehmen Meta hat einen ersten Einblick in sein neues KI-System “Voicebox” gegeben. Bei diesem handelt es sich um ein fortschrittliches Text-to-Speech-Übersetzungstool, das Texteingaben in Audio umwandeln kann. Allerdings geht Voicebox über die bloße Umwandlung von Text in Sprache hinaus. Mit Hilfe von Sprachmodellen kann das Tool einen Audioclip einer anderen Person nutzen, um eine Text-to-Speech-Übersetzung so klingen zu lassen, als ob diese Person spricht. Dies ist bereits mit wenigen Sekunden an Audioeingabe möglich.

Doch mit dieser innovativen Technologie könnten auch neue Herausforderungen in Bezug auf sogenannte Deepfakes entstehen. Es existieren bereits ähnliche Tools auf dem Markt, doch Meta betont, dass diese nicht das gleiche Leistungsniveau erreichen wie das neue Voicebox-Verfahren.

“Voicebox kann qualitativ hochwertige Audioclips produzieren und zuvor aufgenommene Audiodateien bearbeiten – z. B. das Entfernen von Autohupen oder Hundegebell – und dabei den Inhalt und den Stil der Audiodateien beibehalten. Das Modell ist außerdem mehrsprachig und kann Sprache in sechs Sprachen produzieren. In Zukunft könnten generative Mehrzweck-KI-Modelle wie Voicebox virtuellen Assistenten und Nicht-Spieler-Charakteren im Metaverse natürlich klingende Stimmen verleihen. Sie könnten es sehbehinderten Menschen ermöglichen, schriftliche Nachrichten von Freunden von der KI in ihrer Stimme vorgelesen zu bekommen, sie könnten Kreativen neue Werkzeuge an die Hand geben, um auf einfache Weise Audiospuren für Videos zu erstellen und zu bearbeiten, und vieles mehr.”

Meta

Marktübergreifende Möglichkeiten und breitere Anwendungsfälle

Der eigentliche Nutzen von Voicebox liegt in der Fähigkeit zur Übersetzung und der Erzeugung von vereinfachten, muttersprachlichen Varianten von Texteingaben in verschiedenen Sprachen. Dies könnte neue Möglichkeiten eröffnen, die über einzelne Märkte hinausgehen. Die fortschrittliche Modellierung des Systems könnte zudem breitere Anwendungsfälle und Prozesse erleichtern, was weitere wichtige Vorteile bieten könnte.

Meta behält Risiken im Blick

Obwohl Voicebox neue Möglichkeiten eröffnet, bringt es auch Herausforderungen mit sich, insbesondere im Hinblick auf Deepfakes. Bestehende Tools bieten ähnliche Funktionen, erreichen jedoch laut Meta nicht die Qualität von Voicebox. Trotz des enormen Potenzials hat Meta den Quellcode und die App nicht öffentlich gemacht, um potenziellen Missbrauch zu verhindern. Die jüngste Ankündigung ist somit weniger eine Markteinführung als vielmehr ein Versprechen für zukünftige, wertvolle Anwendungen dieser Technologie.

jetzt den contentking.de Newsletter abonnieren

Und wir halten Dich immer auf dem aktuellen Stand!

das könnte Dich ebenfalls interessieren

Google Update Juli 2023 – Daten der SEO-Tools schlagen Alarm

Es wurde bereits lange erwartet und nun scheint das aktuelle Juli 2023 Google Update in vollem Gange zu sein. Die bekannten SEO-Tools zeigen sehr überhitzte Werte für die Rankingfluktuationen – Die SEO-Community ist allerdings noch erstaunlich ruhig für die scheinbar massive Bewegung in den SERPs.

iContact übernimmt MOZ – Marktkonsolidierung schreitet voran.

Der Online Marketing Markt befindet sich auch 2021 in einem Stadium der Konsolidierung: der eMail-Marketing-Riese iContact hat nun den SEO-Spezialisten und Toolanbieter MOZ übernommen.

Werbung verändert sich: weitere Tracking-Einschränkungen bei Google

Google hat in einem Blogbeitrag erneut verkündet, das Tracking von Nutzern und personalisierte Werbung zukünftig zu unterlassen. Einen besonderen Anlass dazu gab es nicht, die Ersatz-Technologie wurde bereits im Januar angekündigt. Wenn mit der Mitteilung das Ziel verfolgt wird, dass viel über das Ende der personalisierten Werbung beim Suchmaschinengiganten berichtet wird, ist der Plan aufgegangen.

Google stellt Cookie-Alternative FLoC vor

Google macht sich bereit für eine Internet-Welt ohne Cookies. Der Privacy-First Ansatz soll in Googles Anzeigengeschäft künftig mittels “Federal Learning of Cohorts”, kurz “FLoC” umgesetzt werden. Die Cookie-Alternative soll jedoch ähnlich hohe Konversionsraten hervorrufen.