Universalübersetzer für alle Sprachen dieser Welt – Meta ist schon dran!

Der Social-Media-Konzern Meta (Facebook) arbeitet an seinem Metaversum, das künftig virtuelle Arbeits- und Freizeitwelten umfassen soll. Laut Meta gehöre dazu auch ein universeller Übersetzer, der alle Sprachen dieser Welt, seien sie auch noch so selten, beherrscht und in Echtzeit in andere Sprachen übersetzt.

Unsere Kommunikationsfähigkeit begründe unser Menschsein, schreibt Meta in diesem Bericht: „KI beibringen, 100e gesprochene und geschriebene Sprachen in Echtzeit zu übersetzen“. Technologien hätten demnach unsere Art zu kommuni­zieren und Ideen auszutauschen immer wieder verändert. Und die Macht der Technologien würde sich noch verstärken, wenn sie für Milliarden von Menschen auf der ganzen Welt auf die gleiche Weise funktionieren könnten – indem sie für einen ähnlichen Zugang zu Informationen sorgen und es ermöglichen, mit einem viel größeren Publikum zu kommunizieren, unabhängig davon, in welcher Sprache. Da Meta eine integrativere und vernetztere Welt anstrebe, werde es noch wichtiger sein, die bestehenden Barrieren zu Informationen und Chancen zu überwinden, indem die Menschen in ihrer jeweiligen Sprache unterstützt würden:

Mit einem universellen Übersetzer, der die Sprachen alle Menschen auf der Welt einbezöge, ließe sich die digitale und die physische Welt auf eine Weise öffnen, die bisher nicht möglich sei, schreibt Meta weiter.

Demnach sei das Beseitigen von Sprachbarrieren maßgeblich und würde Milliarden von Menschen den Online-Zugang zu Informationen in ihrer Muttersprache oder ihrer bevorzugten Sprache ermöglichen. Fortschritte würden nicht nur jenen Menschen helfen, die keine der Sprachen sprechen, die heute das Internet dominieren, sondern auch die Art und Weise grundlegend verändern, wie Menschen auf der Welt miteinander in Kontakt treten und Ideen austauschen.

Universalübersetzer

Noch gibt es keinen Universalübersetzer. Doch unsere professionellen Übersetzer und Dolmetscher beherrschen alle Sprachen und Dialekte dieser Welt.

Stellen Sie uns direkt Ihre Anfrage – wir freuen uns darauf!

Unverbindliche Übersetzungs-Anfrage oder Dolmetscher-Anfrage

Meta arbeite bereits daran und mache Fortschritte beim Ermöglichen von Übersetzungen für Sprachen mit geringen Ressourcen, die für den Großteil der Weltbevölkerung ein erhebliches Hindernis für universelle Übersetzungen darstellen würden. Indem man die Arbeit in Bereichen wie

  • Korpuserstellung,
  • mehrsprachige Modellierung
  • und Evaluierung

vorantreibe und offenlege, hoffe man, dass andere Forscher auf dieser Arbeit aufbauen und die realen Einsatzmöglichkeiten von Übersetzungssystemen näher an die Realität heranbringen könnten.

Meta erklärt, dass es für Menschen, die Weltsprachen wie Englisch, Mandarin oder Spanisch verstünden, so aussehen möge, als ob die heutigen Anwendungen und Webtools bereits die Übersetzungstechnologie böten, die wir bräuchten. Aber Milliarden von Menschen blieben noch immer außen vor – sie könnten Meta zufolge nicht einfach auf die meisten Informationen im Internet zugreifen oder sich mit dem Großteil der Online-Welt in ihrer Muttersprache verbinden.

Denn die derzeitigen maschinellen Übersetzungssysteme (MT) würden sich zwar schnell verbessern, aber sie seien immer noch stark darauf angewiesen, aus großen Mengen von Textdaten zu lernen. Deshalb würden sie sich im Allgemeinen nicht gut für Sprachen mit geringen Ressourcen eignen, also für Sprachen,

  • denen es entweder an Trainingsdaten fehle
  • oder die kein standardisiertes Schriftsystem hätten.

Heutige KI-Übersetzungssysteme seien demzufolge nicht dafür ausgelegt, die Tausenden von Sprachen zu bedienen, die weltweit verwendet würden, oder Sprache-zu-Sprache-Übersetzungen in Echtzeit zu liefern. Um wirklich allen zu dienen, müsse die Forschung drei wichtige Herausforderungen bewältigen.

  1. Datenknappheit überwinden, indem mehr Trainingsdaten in mehr Sprachen gesammelt und neue Wege gefunden würden, um die bereits verfügbaren Daten zu nutzen.
  2. Modellierung bewältigen, indem wir die Herausforderungen meistern, die sich ergäben, wenn die Modelle für immer mehr Sprachen eingesetzt würden.
  3. Ergebnisse bewerten und verbessern, indem wir neue Wege dafür finden.

Die Datenknappheit sei eine der größten Hürden für die Ausweitung von Übersetzungstools auf mehr Sprachen. Maschinelle Übersetzungssysteme für Textübersetzungen seien in der Regel auf das Lernen aus Millionen von Sätzen annotierter Daten angewiesen. Aus diesem Grund seien MÜ-Systeme, die qualitativ hochwertige Übersetzungen liefern könnten, bislang nur für die wenigen Sprachen entwickelt worden, die im Internet vorherrschten. Das Ausweiten auf andere Sprachen bedeute, dass Wege gefunden werden müssten, Trainingsbeispiele aus Sprachen mit geringer Internetpräsenz zu erwerben und zu verwenden.

Beim direkten Übersetzen von Sprache zu Sprache sei die Datenbeschaffung noch herausfordernder. Die meisten Sprach-MT-Systeme würden Text als Zwischenschritt verwenden: Gesprochenes in einer Sprache wird zunächst in Text umgewandelt, dann in Text in der Zielsprache übersetzt und schließlich in ein Text-to-Speech-System eingegeben, um Audio zu erzeugen. Somit seien die Sprach-zu-Sprache-Übersetzungen in einer Weise vom Text abhängig, die ihre Effizienz einschränke und die Skalierung auf Sprachen, die hauptsächlich mündlich gesprochen würden, erschwere.

Direkte Sprache-zu-Sprache-Übersetzungsmodelle könnten Übersetzungen für Sprachen ermöglichen, die keine standardisierten Schriftsysteme hätten. Dieser sprachbasierte Ansatz könnte auch zu wesentlich schnelleren und effizienteren Übersetzungssystemen führen, da die zusätzlichen Schritte der Umwandlung von Sprache in Text, der Übersetzung und der anschließenden Erzeugung von Sprache in der Zielsprache entfielen.

Meta erklärt weiter, dass die heutigen maschinellen Übersetzungssysteme nicht so ausgelegt seien, dass sie den Anforderungen aller Menschen auf der ganzen Welt gerecht würden – ganz zu schweigen davon, dass sie geeignete Trainingsdaten in Tausenden von Sprachen benötigen. Viele MÜ-Systeme seien zweisprachig, es gebe also für jedes Sprachpaar ein eigenes Modell, beispielsweise Englisch-Russisch oder Japanisch-Spanisch. Dieser Ansatz sei außerordentlich schwierig auf Dutzende von Sprachpaaren zu skalieren, geschweige denn auf alle weltweit verwendeten Sprachen.

Viele Experten hätten Meta zufolge vorgeschlagen, dass mehrsprachige Systeme hier hilfreich sein könnten. Es sei demnach jedoch äußerst schwierig, viele Sprachen in ein einziges effizientes, leistungsfähiges mehrsprachiges Modell einzubinden, das alle Sprachen abbilden könne.

Die Echtzeit-Sprachverarbeitung stünde laut dem Meta-Bericht vor vielen der gleichen Herausforderungen wie textbasierte Modelle. Hinzu käme, dass hier die Latenz, also die Verzögerung, die beim Übersetzen von einer Sprache in eine andere entstehe, überwunden werden müsse, bevor sie effektiv für Echtzeit-Übersetzungen eingesetzt werden könnten. Die größte Herausforderung ergebe sich demnach aus der Tatsache, dass ein Satz in verschiedenen Sprachen in unterschiedlicher Wortfolge gesprochen werden könne.

Selbst professionelle Simultandolmetscher würden laut Meta der Originalsprache um etwa drei Sekunden hinterherhinken. Als Beispiel wird in dem Bericht dieses gebracht:

Angenommen, der deutsche Satz „Ich möchte alle Sprachen übersetzen“ und seine spanische Entsprechung „Quisiera traducir todos los idiomas“ sollen ins Englische übersetzt werden. Die Übersetzung vom Deutschen ins Englische in Echtzeit wäre laut dem Meta-Bericht herausfordernder, da das Verb „übersetzen“ am Ende des Satzes steht, während die Wortfolge im Spanischen und Englischen ähnlich sei.

Schließlich müssten mit dem Ausweiten auf immer mehr Sprachen auch neue Methoden zum Bewerten der von MT-Modellen produzierten Übersetzungen entwickelt werden. Es gebe laut Meta zwar bereits Ressourcen zur Bewertung der Qualität von Übersetzungen, beispielsweise vom Englischen ins Russische, aber die Frage sei: Wie sieht es mit Übersetzungen vom Amharischen ins Kasachische aus?

Um die Anzahl der Sprachen, die derzeitige MÜ-Modelle übersetzen könnten, zu erweitern, seien auch neue Ansätze für Trainingsdaten und Messungen nötig, um mehr Sprachen abzudecken.

Dabei komme es nicht nur auf die Genauigkeit an, sondern auch darauf, die Übersetzungen verantwortungsvoll auszuführen. Es müssten Wege gefunden werden, die sicherstellen, dass MÜ-Systeme kulturelle Sensibilitäten bewahrten und keine Vorurteile schaffen oder verstärken würden.

Und genau daran arbeite Meta KI aktuell. Es bleibt spannend.

Sie brauchen Übersetzer oder Dolmetscher für selten gesprochene Sprachen? Kein Problem! Unsere Sprachexperten stehen Ihnen mit allen Sprachen und Dialekten dieser Welt hilfreich zur Seite, versprochen!

Stellen Sie uns Ihre Anfrage – selbstverständlich unverbindlich!

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.