Explainer

Live-Untertitel vs. Live-Übersetzung — was ist der Unterschied?

Untertitel machen Events für Gehörlose und Schwerhörige zugänglich. Übersetzung übersetzt Sprache in Echtzeit in eine andere Sprache. Erfahren Sie, wann Sie was verwenden.

Zuletzt aktualisiert · 24. Mai 2026 6 Min. Lesezeit

Die Begriffe «Live-Untertitel» und «Live-Übersetzung» werden oft synonym verwendet. Sie sind jedoch nicht dasselbe. Eine Vermischung führt zu falschen Erwartungen — Organisatoren, die mehrsprachige Unterstützung erwarteten, erhalten einsprachige Untertitel, und ein Publikum, das übersetztes Audio erwartete, bekommt scrollenden Text in der Sprache des Sprechers.

Dieser Artikel klärt die Unterscheidung, erklärt, wann welche Lösung angemessen ist, und beschreibt, wie beide zusammenwirken können.

Live-Untertitel: Die Worte des Sprechers als Text

Live-Untertitel (auch Echtzeit-Untertitel oder CART — Communication Access Realtime Translation genannt) wandeln gesprochene Worte in Text um, der auf einem Bildschirm angezeigt wird, und zwar in derselben Sprache, die der Sprecher verwendet. Ein englischsprachiger Vortrag erzeugt englische Untertitel. Eine spanischsprachige Vorlesung erzeugt spanische Untertitel.

Untertitel richten sich an zwei Hauptzielgruppen:

Gehörlose und schwerhörige Teilnehmer, die den Sprecher nicht hören können und auf Text angewiesen sind, um dem Inhalt zu folgen.
Zuhörer in lauter Umgebung — große Säle, Außenbereiche oder Räume mit schlechter Akustik —, die Schwierigkeiten haben, deutlich zu hören.

Untertitel übersetzen nicht. Sie transkribieren. Die Ausgabesprache entspricht der Eingabesprache.

Wie Untertitel funktionieren

Modernes Untertiteln nutzt automatische Spracherkennung (ASR), um Text nahezu in Echtzeit zu erzeugen. Das Audio des Sprechers wird von einer Spracherkennungs-Engine verarbeitet, und der resultierende Text erscheint mit einer Latenz von ein bis drei Sekunden auf dem Bildschirm.

Die Qualität variiert. Professionelle CART-Untertitler (menschliche Stenografen) liefern nahezu perfekte Genauigkeit, kosten jedoch $150–$300 pro Stunde. ASR-generierte Untertitel (KI) erreichen 90–97 % Genauigkeit bei einem Bruchteil der Kosten, mit gelegentlichen Fehlern bei Eigennamen, Fachbegriffen und starken Akzenten.

Live-Übersetzung: Die Aussage des Sprechers in einer anderen Sprache

Live-Übersetzung wandelt gesprochene Worte in Echtzeit in eine andere Sprache um. Ein englischsprachiger Vortrag erzeugt gleichzeitig französisches Audio, spanische Untertitel und japanischen Text. Das Ergebnis ist keine Transkription; es ist eine Übersetzung.

Live-Übersetzung richtet sich an eine grundlegend andere Zielgruppe:

Teilnehmer, die die Sprache des Sprechers nicht beherrschen und den Inhalt in ihrer eigenen Sprache benötigen.
Mehrsprachige Veranstaltungen — Konferenzen, diplomatische Briefings, Unterrichtsräume —, in denen eine einzige Arbeitssprache einen Teil des Publikums ausschließt.

Wie Live-Übersetzung funktioniert

Der Prozess besteht aus drei Phasen:

Sprache-zu-Text (STT): Das Audio des Sprechers wird in Text in der Ausgangssprache transkribiert.
Maschinelle Übersetzung (MT): Der transkribierte Text wird in die Zielsprache(n) übersetzt.
Text-zu-Sprache (TTS) oder Textanzeige: Der übersetzte Text wird entweder als Audio synthetisiert (natürlich klingende Stimme) oder als Live-Untertitel in der Zielsprache angezeigt.

Vollständige Audioübersetzung ist in 51 Sprachen verfügbar. Weitere 174 Sprachen erhalten Live-Textuntertitel — übersetzte Untertitel, keine transkribierten.

Wesentliche Unterschiede auf einen Blick

Dimension	Live-Untertitel	Live-Übersetzung
Ausgabe	Text in derselben Sprache	Audio und/oder Text in einer anderen Sprache
Hauptzielgruppe	Gehörlose/Schwerhörige, laute Umgebungen	Nichtmuttersprachler, mehrsprachiges Publikum
Sprachen	1 (entspricht dem Sprecher)	Über 200 (unabhängig vom Sprecher)
Barrierefreiheitszweck	Hör-Barrierefreiheit	Sprach-Barrierefreiheit
Übertragungsformat	Text auf dem Bildschirm	Audio auf das Gerät des Zuhörers + optionaler Text auf dem Bildschirm
Regulatorische Nutzung	ADA, WCAG, Section 508 (Barrierefreiheitsvorschriften)	Keine regulatorische Anforderung (noch), aber zunehmend bei internationalen Veranstaltungen erwartet

Wann welche Lösung eingesetzt wird

Verwenden Sie Live-Untertitel, wenn:

Ihr Publikum dieselbe Sprache spricht wie der Sprecher, aber gehörlose oder schwerhörige Teilnehmer umfasst
Der Veranstaltungsort eine schlechte Akustik hat und die Teilnehmer Schwierigkeiten beim Hören haben
Gesetzliche Vorgaben (ADA, WCAG) Untertitel vorschreiben
Die Veranstaltung einsprachig ist und Sie das Verständnis verbessern möchten, nicht übersetzen

Verwenden Sie Live-Übersetzung, wenn:

Ihr Publikum Personen umfasst, die die Sprache des Sprechers nicht beherrschen
Die Veranstaltung international, multilateral oder interkulturell ist
Sie die Reichweite der Veranstaltung auf Communitys ausdehnen möchten, die die Arbeitssprache nicht sprechen
Sie für ein weltweites Online-Publikum übertragen

Verwenden Sie beides, wenn:

Sie ein mehrsprachiges Publikum haben, das auch gehörlose und schwerhörige Teilnehmer umfasst
Sie gleichzeitig übersetzte Untertitel auf dem Bildschirm und übersetztes Audio auf persönliche Geräte übertragen möchten
Sie eine hochkarätige Veranstaltung durchführen, bei der sowohl Barrierefreiheit als auch Mehrsprachigkeit erwartet werden

Wie sie sich ergänzen

Live-Untertitel und Live-Übersetzung sind keine Konkurrenten. Sie lösen unterschiedliche Probleme, und die wirksamsten Veranstaltungen nutzen beide:

Bildschirmuntertitel in der Sprache des Sprechers dienen gehörlosen und schwerhörigen Teilnehmern sowie allen im Raum, die vom Mitlesen profitieren.
Übersetztes Audio auf persönliche Geräte dient Nichtmuttersprachlern, die den Inhalt in ihrer eigenen Sprache benötigen.
Übersetzte Untertitel auf einem zweiten Bildschirm dienen Delegierten, die lieber in ihrer Sprache lesen, als synthetisiertes Audio anzuhören.

Loquira bietet beides: die Sprache des Sprechers als Live-Untertitel sowie 51 Sprachen mit vollständigem Audio und 174 mit übersetzten Untertiteln. Beide Systeme laufen parallel aus derselben Audioquelle, ohne zusätzliche Einrichtung.

Ein häufiges Missverständnis

«Live-Untertitel mit automatischer Übersetzung» — die Funktion, die in einigen Videokonferenz-Tools zu finden ist — ist keine Live-Übersetzung im hier beschriebenen Sinne. Diese Systeme übersetzen den Untertiteltext mithilfe einer einfachen maschinellen Übersetzungsschicht und liefern Ergebnisse, die oft grammatikalisch falsch, inhaltlich unpassend und als statischer Text mit mehreren Sekunden Verzögerung geliefert werden.

Professionelle Live-Übersetzung nutzt domänenspezifische Übersetzungsmodelle, kontextbewusste Sprachverarbeitung und optimierte Sprachsynthese. Der Qualitätsunterschied ist sofort erkennbar, insbesondere bei weniger häufigen Sprachpaaren und technischem Inhalt.

Fazit

Untertitel machen Sprache lesbar. Übersetzung macht Sprache über Sprachgrenzen hinweg verständlich. Beides ist wichtig. Keines ersetzt das andere. Wenn Ihre Veranstaltung Personen umfasst, die die Sprache des Sprechers nicht beherrschen, benötigen Sie Übersetzung — Untertitel allein werden diese Lücke nicht schließen.

Benötigen Sie Live-Übersetzung für Ihre nächste Veranstaltung? Starten Sie eine kostenlose Sitzung — Untertitel und Übersetzung in über 200 Sprachen, ohne Einrichtung erforderlich.