Zum Inhalt springen
Zurück zu Anleitungen
Operations

Transkriptionen nach der Veranstaltung kuratieren

Bereinigen, zuordnen und verteilen mehrsprachiger Transkriptionen, damit das Nachbereitungsdokument einer genauen Prüfung standhält.

Zuletzt aktualisiert · 16. Mai 2026 7 Min. Lesezeit

Eine rohe Loquira-Transkription erfasst jedes Wort, das die Spracherkennungs-Engine erkannt hat: vollständige Sätze, Satzfragmente, Fehlstarts, wiederholte Füllwörter und Artefakte von Übersprechen. Es ist eine genaue Aufzeichnung dessen, was die Engine gehört hat. Es ist kein veröffentlichungsfähiges Dokument.

Diese Anleitung behandelt den Kuratierungsdurchgang – die Mindestbereinigung, die eine rohe Transkription in ein Dokument verwandelt, das für die Verteilung, Zitation und Archivierung geeignet ist.

Der minimale Bereinigungsdurchgang

Eine kuratierte Transkription sollte drei Tests bestehen:

  1. Ein Leser kann identifizieren, wer was gesagt hat.
  2. Der Text fließt wie geschriebene Prosa, nicht wie stockende Rede.
  3. Kein sensibles Material erscheint in der verteilten Version.

Schritt 1: Sprecherzuordnung. Die rohe Transkription zeichnet Äußerungen als einen einzigen Strom auf. Wenn mehrere Sprecher aktiv waren, fügen Sie bei der ersten Äußerung jedes Sprechers und bei jedem Sprecherwechsel eine Sprecherkennzeichnung hinzu. Verwenden Sie den Namen oder die Rolle des Sprechers: „Alina Novak (CEO):” oder „Moderator:”. Identifizieren Sie bei Pressekonferenzen Journalisten nach Medium, wenn die Erlaubnis erteilt wurde: „Frage – Le Monde:”.

Schritt 2: Absatzumbrüche und Struktur. Die rohe Transkription kommt als Block zeitgestempelter Segmente an. Fügen Sie Absatzumbrüche bei natürlichen Themenwechseln ein. Wenn die Tagesordnung des Abends drei Themen umfasste, sollte die Transkription drei Abschnitte haben. Fügen Sie Überschriftenannotationen in eckigen Klammern für Themenwechsel hinzu: „[Übergang zur Fragerunde]”.

Schritt 3: Redeflussstörungen bereinigen. Entfernen Sie wiederholte Füllwörter (ähm, also, wissen Sie, quasi, irgendwie). Die Spracherkennungs-Engine gibt jedes einzelne Äußern getreu wieder, einschließlich dieser. Eine kuratierte Version dient dem Leser besser, indem sie diese auslässt. Korrigieren Sie nicht die Grammatik, formulieren Sie Sätze nicht um und ändern Sie nicht die Bedeutung des Sprechers. Die Transkription ist eine Aufzeichnung, keine Neufassung.

Abgleich übersetzter Transkriptionen mit dem Original

Wenn während einer Sitzung mehrere Ausgabesprachen aktiv waren, ist jede Sprachtranskription eine unabhängige Wiedergabe der Originalsprache. Eine direkte Rückübersetzung der französischen Transkription ins Englische wird nicht wortwörtlich mit dem englischen Original übereinstimmen – Übersetzungen führen zwangsläufig zu Variationen in Formulierung, Idiom-Behandlung und Satzstruktur.

So gleichen Sie für die Verteilung ab:

  • Verteilen Sie die Transkription in der Originalsprache als die maßgebliche Version.
  • Verteilen Sie jede übersetzte Transkription zusammen mit dem Original, deutlich gekennzeichnet: „Französische Übersetzung (maschinell erstellt)”.
  • Versuchen Sie nicht, die Übersetzungen manuell mit dem Original zu harmonisieren. Die Variation ist dem Übersetzungsprozess inhärent und deutet nicht auf Fehler hin.

Wenn eine bestimmte Passage in allen Sprachversionen identisch sein muss – eine Richtlinienerklärung, ein rechtlicher Haftungsausschluss, ein wichtiges Zitat – überprüfen Sie die Übersetzung dieser Passage separat und kommentieren Sie die Transkription gegebenenfalls. Dies ist für die meisten Anwendungsfälle selten, aber für regulatorische oder Compliance-Kontexte wesentlich.

Schwärzung für sensibles Material

Überprüfen Sie die Transkription vor der externen Verteilung auf sensible Inhalte, die nicht in der veröffentlichten Version erscheinen sollten.

Wonach Sie suchen sollten:

  • Personenbezogene Daten (Telefonnummern, E-Mail-Adressen, Privatadressen), die während der Veranstaltung genannt wurden. Die Spracherkennungs-Engine erfasst diese genau.
  • Off-the-Record-Bemerkungen, die während On-the-Record-Segmenten gemacht wurden. Ein Sprecher kann mitten im Satz von On-the-Record zu Off-the-Record wechseln.
  • Wirtschaftlich sensible zukunftsgerichtete Aussagen, die für den Raum freigegeben waren, aber nicht für die externe Verteilung.

Schwärzungsmethode: Ersetzen Sie die sensible Passage durch eine beschreibende Angabe in eckigen Klammern: „[Geschwärzt – wirtschaftlich sensibel]” oder „[Personenbezogene Daten entfernt]”. Verwenden Sie nicht die rohe Transkription als Schwärzungsnachweis; der Text befindet sich an derselben Position. Erstellen Sie eine separate geschwärzte Datei.

Archivierungskonventionen für Langzeitaufzeichnungen

Organisationen, die wöchentliche oder monatliche Loquira-Sitzungen durchführen, sammeln ein Transkriptionsarchiv an. Ohne Namenskonventionen wird das Archiv innerhalb weniger Quartale unbrauchbar.

Empfohlene Archivstruktur:

/transcripts/
  YYYY/
    YYYY-MM-DD_veranstaltungsname/
      YYYY-MM-DD_veranstaltungsname_de.txt
      YYYY-MM-DD_veranstaltungsname_fr.txt
      YYYY-MM-DD_veranstaltungsname_ja.txt
      YYYY-MM-DD_veranstaltungsname_metadata.json

Die Metadaten-JSON-Datei speichert Informationen auf Sitzungsebene: Sprechername, Veranstaltungstyp, Dauer, Anzahl der Zuhörer pro Sprache und etwaige Anmerkungen des Kurators (z. B. „Frage-Antwort-Segment fehlt – Mikrofon war während der Fragerunde aus”).

Aufbewahrungsentscheidungen pro Veranstaltung:

Nicht jede Transkription muss auf unbestimmte Zeit aufbewahrt werden. Legen Sie für jeden Veranstaltungstyp eine Aufbewahrungskategorie fest:

VeranstaltungstypAufbewahrungBeispiel
VorstandssitzungenDauerhaftJährliche Hauptversammlung
Interne Mitarbeiterversammlungen2 JahreVierteljährliche Betriebsversammlung
Pressekonferenzen1 JahrProdukteinführung
Wöchentliche Stand-ups90 TageEngineering-Sync
Testsitzungen30 TageProbelauf vor einer Veranstaltung

Wenden Sie die Aufbewahrung auf Archivebene an, nicht dateibasiert. Ein Skript, das Erstellungsdaten von Ordnern mit der Aufbewahrungsrichtlinie abgleicht, kann die Bereinigung automatisieren.

Verwandte Inhalte