콘텐츠로 건너뛰기
가이드(으)로 돌아가기
Broadcasting

라이브 방송에 실시간 자막 삽입하기

Loquira의 번역 출력을 사용하여 번역된 자막을 방송 그래픽 파이프라인에 통합하는 방법.

최종 업데이트 · 2026년 5월 17일 4분 읽기

방송사는 자막을 원합니다 — 깔끔하고, 번역되어 있으며, 하단 그래픽과 티커를 처리하는 동일한 그래픽 파이프라인으로 전달되길 바랍니다. 이 가이드는 Loquira 번역 파이프라인의 지연 시간 특성과 현재 출력을 활용하는 방법을 다룹니다.

지연 시간 예산

방송사는 엄격한 타이밍 제약 내에서 운영됩니다. 모든 프레임에는 예정된 위치가 있습니다. Loquira의 종단간 지연 시간을 이해하면 방송 스택에서 자막 배치를 계획하는 데 도움이 됩니다.

단계지연 시간
음성 인식 (Deepgram Nova-3)~300ms
번역 (Gemini)~250ms
텍스트 음성 변환 합성~200ms
전체 종단간~750ms

이는 대부분의 방송사가 라이브 이벤트를 위해 유지하는 지연 버퍼(일반적으로 법적 검토 및 욕설 지연을 위해 3~10초)에 잘 들어맞습니다. 뉴스 취재, 기자회견, 라이브 이벤트 방송에서 실시간 송출 경로는 현실적인 선택지입니다.

현재 번역 출력 활용하기

Loquira의 청중 뷰는 번역된 텍스트와 오디오를 실시간으로 표시합니다. 방송 통합을 위해 현재 두 가지 접근 방식이 가능합니다:

세션 후 자막 오버레이. 세션 종료 후 SRT 또는 WebVTT 형식으로 자막을 내보냅니다. 편집 또는 재생 시스템으로 파일을 가져와 녹화된 방송에 자막을 입힙니다. 이것이 가장 안정적인 방법이며 모든 그래픽 파이프라인에서 작동합니다.

참고용 청중 뷰. 전용 기기에서 Loquira 청중 뷰를 열고 화면 밖에 배치합니다. 자막 운영자가 번역된 텍스트를 보고 수동으로 그래픽 시스템에 입력합니다. 이는 사람의 지연 시간을 추가하지만 타이밍과 가시성에 대한 완전한 편집 제어권을 제공합니다.

방송 그래픽 시스템(OBS, vMix, CasparCG)으로의 직접 자막 피드 통합은 제품 로드맵에 있습니다.

대비해야 할 장애 모드

  • 발표자 기기의 네트워크 손실. 번역이 즉시 중단됩니다. 대체 그래픽(“실시간 번역을 일시적으로 사용할 수 없습니다”)을 준비하세요.
  • 소스의 오디오 드롭아웃. 인식기는 침묵 구간에 대해 자막을 생성하지 않습니다. 방송 진행자에게 기다리기보다는 말을 채우도록 안내하세요.
  • 방송 중간 언어 전환. 가능하지만 — 번역 파이프라인이 재워밍되는 동안 1~2초의 간격이 발생합니다. 세그먼트 사이에만 전환하세요.

관련 자료