Operations

Transcripten nabewerken na het evenement

Opschonen, toeschrijven en distribueren van meertalige transcripten zodat het nabezorgingsdocument kritiek kan doorstaan.

Laatst bijgewerkt · 16 mei 2026 7 min leestijd

Een ruw Loquira-transcript legt elk woord vast dat de spraakengine herkende: volledige zinnen, zinfragmenten, valse starts, herhaalde opvulwoorden en kruisgesprek-artefacten. Het is een nauwkeurig verslag van wat de engine hoorde. Het is geen publiceerbaar document.

Deze gids behandelt de nabewerkingsronde — de minimale opschoon die een ruw transcript omzet in een document dat geschikt is voor distributie, citeren en archivering.

De minimale opschoonronde

Een nabewerkt transcript moet drie tests doorstaan:

Een lezer kan identificeren wie wat zei.
De tekst stroomt als geschreven proza, niet als disfluente spraak.
Geen gevoelig materiaal verschijnt in de gedistribueerde versie.

Stap 1: Sprekertoewijzing. Het ruwe transcript registreert uitingen als één stroom. Als meerdere sprekers actief waren, voeg een sprekerlabel toe bij de eerste uiting van elke spreker en wanneer de spreker verandert. Gebruik de naam of rol van de spreker: “Alina Novak (CEO):” of “Moderator:”. Voor persconferenties identificeer je journalisten per uitgeverij als toestemming is verleend: “Vraag — Le Monde:”.

Stap 2: Alinea-afbrekingen en structuur. Het ruwe transcript komt als een blok getimede segmenten. Voeg alinea-afbrekingen in bij natuurlijke overgangen van onderwerpen. Als de avondagenda drie onderwerpen behandelde, moet het transcript drie secties hebben. Voeg kop-annotaties toe tussen vierkante haken voor onderwerpverschuivingen: “[Overgang naar Q&A]”.

Stap 3: Disfluencies opschonen. Verwijder herhaalde opvulwoorden (um, uh, je weet wel, soort van). De spraakengine reproduceert elke uiting getrouw inclusief deze. Een nabewerkte versie dient de lezer beter door ze weg te laten. Doe geen grammaticacorrectie, zinnen herformuleren of de betekenis van de spreker veranderen. Het transcript is een verslag, geen herschrijving.

Vertaalde transcripten verzoenen met het origineel

Wanneer een sessie meerdere uitvoertalen actief had, is elk taaltranscript een onafhankelijke weergave van de originele spraak. Een directe terugvertaling van het Franse transcript naar het Engels zal niet woord-voor-woord overeenkomen met het Engelse origineel — vertaling introduceert legitieme variatie in zinsbouw, idioomafhandeling en zinsstructuur.

Hoe te verzoenen voor distributie:

Distribueer het originele taaltranscript als de gezaghebbende versie.
Distribueer elk vertaald transcript ernaast, duidelijk gelabeld: “Franse vertaling (machine-generated)”.
Probeer niet handmatig de vertalingen te harmoniëren met het origineel. De variatie is inherent aan het vertaalproces en duidt geen fouten aan.

Als een specifieke passage identiek moet zijn in alle taalversies — een beleidsverklaring, een juridische disclaimer, een belangrijk citaat — verifieer de vertaling van die passage afzonderlijk en annoteer het transcript indien nodig. Dit is zeldzaam voor de meeste gebruikcases maar essentieel voor regelgevende of nalevingscontexten.

Redactie voor gevoelig materiaal

Voordat je een transcript extern distribueert, beoordeel het op gevoelige inhoud die niet in de gepubliceerde versie mag verschijnen.

Waar je op let:

Persoonlijk identificeerbare informatie (telefoonnummers, e-mailadressen, thuisadressen) gesproken tijdens het evenement. De spraakengine legt deze nauwkeurig vast.
Off-the-record opmerkingen gemaakt tijdens on-the-record segmenten. Een spreker kan halverwege een zin overgaan van on-the-record naar off-the-record.
Commercieel gevoelige toekomstgerichte verklaringen die zijn goedgekeurd voor de kamer maar niet voor externe distributie.

Redactiemethode: Vervang de gevoelige passage door een omschrijving tussen vierkante haken: “[Geredigeerd — commercieel gevoelig]” of “[Persoonlijke informatie verwijderd]”. Gebruik niet het ruwe transcript als redactiebewijs; de tekst staat op dezelfde positie. Maak een apart geredigeerd bestand.

Archieconventies voor langdurige records

Organisaties die wekelijks of maandelijks Loquira-sessies houden bouwen een transcriptarchief op. Zonder naamgevingsconventies wordt het archief binnen een paar kwartalen onbruikbaar.

Aanbevolen archiefstructuur:

/transcripts/
  YYYY/
    YYYY-MM-DD_evenementnaam/
      YYYY-MM-DD_evenementnaam_en.txt
      YYYY-MM-DD_evenementnaam_fr.txt
      YYYY-MM-DD_evenementnaam_ja.txt
      YYYY-MM-DD_evenementnaam_metadata.json

Het metadata JSON-bestand slaat sessie-informatie op: sprekersnaam, evenementtype, duur, aantal luisteraars per taal en eventuele curatoropmerkingen (bijv. “Q&A-segment ontbreekt — microfoon stond uit tijdens Q&A”).

Bewaarbeslissingen per evenement:

Niet elk transcript hoeft voor onbepaalde tijd te worden bewaard. Stel een bewaarcategorie vast voor elk evenementtype:

Evenementtype	Bewaring	Voorbeeld
Bestuursvergaderingen	Permanent	Jaarlijkse aandeelhoudersvergadering
Interne all-hands	2 jaar	Kwartaal town hall
Persconferenties	1 jaar	Productlancering
Wekelijkse stand-ups	90 dagen	Engineering sync
Testsessies	30 dagen	Droge run voor een evenement

Pas bewaring toe op archiefniveau, niet per bestand. Een script dat mapaanmaakdatums controleert tegen het bewaarbeleid kan de opschoon automatiseren.

De minimale opschoonronde

Vertaalde transcripten verzoenen met het origineel

Redactie voor gevoelig materiaal

Archieconventies voor langdurige records

Gerelateerd