콘텐츠로 건너뛰기
가이드(으)로 돌아가기
Operations

이벤트 후 자막 정리하기

다국어 자막을 정리하고, 발언자를 표시하며, 배포하여 문서의 신뢰성을 확보하는 방법.

최종 업데이트 · 2026년 5월 16일 7분 읽기

원시 Loquira 자막은 음성 엔진이 인식한 모든 단어를 캡처합니다: 완전한 문장, 문장 파편, 말하기 시작의 머뭇거림, 반복되는 추임새, 교차 대화 아티팩트. 이는 엔진이 들은 내용의 정확한 기록입니다. 하지만 게시 가능한 문서는 아닙니다.

이 가이드는 큐레이션 과정을 다룹니다 — 원시 자막을 배포, 인용, 보관에 적합한 문서로 변환하는 최소한의 정리 작업입니다.

최소 정리 작업

큐레이션된 자막은 세 가지 테스트를 통과해야 합니다:

  1. 독자가 누가 무엇을 말했는지 식별할 수 있어야 합니다.
  2. 텍스트가 유창하지 않은 말투가 아닌, 서면 산문처럼 흘러야 합니다.
  3. 배포 버전에 민감한 내용이 포함되지 않아야 합니다.

1단계: 발언자 표시. 원시 자막은 발언을 단일 스트림으로 기록합니다. 여러 발언자가 활동한 경우, 각 발언자의 첫 번째 발언과 발언자가 변경될 때마다 발언자 레이블을 추가하세요. 발언자의 이름이나 역할을 사용하세요: “Alina Novak (CEO):” 또는 “사회자:”. 기자회견의 경우, 언론사가 허가한 경우 언론사명으로 식별하세요: “질문 — Le Monde:”.

2단계: 문단 나누기 및 구조. 원시 자막은 시간 기반 세그먼트의 블록으로 제공됩니다. 자연스러운 주제 전환 지점에 문단 나눔을 삽입하세요. 당일 의제가 세 가지 주제를 다루었다면 자막도 세 개의 섹션으로 구성되어야 합니다. 주제 변경을 위해 대괄호 안에 헤더 주석을 추가하세요: “[Q&A 전환]”.

3단계: 불유창함 정리. 반복되는 추임새(음, 어, 있잖아, 뭐랄까, 일종의)를 제거하세요. 음성 엔진은 이러한 추임새를 포함한 모든 발언을 충실히 재현합니다. 큐레이션 버전은 이를 생략함으로써 독자에게 더 나은 서비스를 제공합니다. 문법을 교정하거나, 문장을 다시 표현하거나, 발언자의 의도를 변경하지 마십시오. 자막은 다시 쓰기가 아닌 기록입니다.

번역 자막과 원본의 조정

세션에서 여러 출력 언어가 활성화된 경우, 각 언어 자막은 원본 발언의 독립적인 표현입니다. 프랑스어 자막을 영어로 다시 번역하면 원본 영어와 단어 하나하나 일치하지 않습니다 — 번역은 표현, 관용구 처리, 문장 구조에 있어 정당한 변형을 도입합니다.

배포를 위한 조정 방법:

  • 원어 자막을 권위 있는 버전으로 배포하세요.
  • 각 번역 자막을 함께 명확히 레이블을 표시하여 배포하세요: “프랑스어 번역 (기계 생성)”.
  • 번역을 원본과 수동으로 일치시키려고 시도하지 마세요. 변형은 번역 프로세스에 내재된 것이며 오류를 나타내지 않습니다.

특정 구절이 모든 언어 버전에서 동일해야 하는 경우 — 정책 성명, 법적 면책 조항, 핵심 인용문 — 해당 구절의 번역을 별도로 확인하고 필요시 자막에 주석을 추가하세요. 이는 대부분의 사용 사례에서는 드물지만 규제 또는 규정 준수 맥락에서는 필수적입니다.

민감한 자료 편집

자막을 외부에 배포하기 전에 게시 버전에 포함되어서는 안 될 민감한 내용이 있는지 검토하세요.

확인할 사항:

  • 이벤트 중에 발언된 개인 식별 정보(전화번호, 이메일 주소, 집 주소). 음성 엔진은 이를 정확히 캡처합니다.
  • 공식 기록 중에 이루어진 오프더레코드 발언. 발언자가 공식 기록과 비공식 기록 사이를 문장 중간에 전환할 수 있습니다.
  • 해당 장소에서는 공개되었지만 외부 배포에는 적합하지 않은 상업적으로 민감한 미래 예측 진술.

편집 방법: 민감한 구절을 대괄호 설명으로 대체하세요: “[편집됨 — 상업적으로 민감한 내용]” 또는 “[개인 정보 삭제됨]”. 원시 자막을 편집 증거로 사용하지 마세요; 동일한 위치에 텍스트가 남아 있습니다. 별도의 편집 파일을 만드세요.

장기 기록을 위한 보관 규칙

주간 또는 월간 Loquira 세션을 운영하는 조직은 자막 아카이브를 축적하게 됩니다. 명명 규칙이 없으면 아카이브는 몇 분기 내에 사용할 수 없게 됩니다.

권장 아카이브 구조:

/transcripts/
  YYYY/
    YYYY-MM-DD_이벤트-이름/
      YYYY-MM-DD_이벤트-이름_ko.txt
      YYYY-MM-DD_이벤트-이름_fr.txt
      YYYY-MM-DD_이벤트-이름_ja.txt
      YYYY-MM-DD_이벤트-이름_metadata.json

메타데이터 JSON 파일은 세션 수준 정보를 저장합니다: 발언자 이름, 이벤트 유형, 시간, 언어별 청중 수, 큐레이터 노트(예: “Q&A 세그먼트 누락 — Q&A 중 마이크가 꺼져 있었음”).

이벤트별 보존 결정:

모든 자막을 영구히 보관할 필요는 없습니다. 이벤트 유형별로 보존 범주를 설정하세요:

이벤트 유형보존 기간예시
이사회 회의영구연례 주주 총회
내부 전체 회의2년분기별 타운홀
기자회견1년제품 출시
주간 스탠드업90일엔지니어링 싱크
테스트 세션30일이벤트 전 리허설

파일 수준이 아닌 아카이브 수준에서 보존을 적용하세요. 폴더 생성 날짜를 보존 정책과 대조하여 확인하는 스크립트로 정리를 자동화할 수 있습니다.

관련 자료