Incorporar legendas ao vivo em uma transmissão
Trazendo legendas traduzidas para um pipeline gráfico de transmissão usando a saída de tradução do Loquira.
Os broadcasters querem legendas — limpas, traduzidas e chegando no mesmo pipeline gráfico que lida com laterais inferiores e tickers. Este guia cobre as características de latência do pipeline de tradução do Loquira e como trabalhar com sua saída atualmente.
Orçamento de latência
Os broadcasters operam dentro de restrições rigorosas de tempo. Cada quadro tem uma posição programada. Entender a latência de ponta a ponta do Loquira ajuda a planejar o posicionamento das legendas na pilha de transmissão.
| Etapa | Latência |
|---|---|
| Reconhecimento de fala (Deepgram Nova-3) | ~300 ms |
| Tradução (Gemini) | ~250 ms |
| Síntese de texto para fala | ~200 ms |
| Total ponta a ponta | ~750 ms |
Isso está bem dentro do buffer de atraso que a maioria dos broadcasters mantém para eventos ao vivo (tipicamente 3–10 segundos para revisão legal e atraso de conteúdo impróprio). Uma rota ao vivo para transmissão é realista para cobertura de notícias, coletivas de imprensa e transmissão de eventos ao vivo.
Trabalhando com a saída traduzida atualmente
A visualização do ouvinte do Loquira exibe texto traduzido e áudio em tempo real. Para integração com transmissão, duas abordagens estão disponíveis atualmente:
Sobreposição de legendas pós-sessão. Após o término da sessão, exporte a transcrição no formato SRT ou WebVTT. Importe o arquivo para seu sistema de edição ou playout para gravar as legendas na transmissão gravada. Este é o método mais confiável e funciona com qualquer pipeline gráfico.
Visualização do ouvinte como referência. Abra a visualização da audiência do Loquira em um dispositivo dedicado e posicione-a fora da tela. Um operador de legendas observa o texto traduzido e insere as legendas manualmente no sistema gráfico. Isso introduz latência humana, mas dá controle editorial total sobre o tempo e a visibilidade.
A integração direta de feed de legendas em sistemas gráficos de transmissão (OBS, vMix, CasparCG) está no roadmap do produto.
Modos de falha para planejar
- Perda de rede no dispositivo do apresentador. A tradução para imediatamente. Tenha um gráfico de fallback (“Tradução ao vivo temporariamente indisponível”) pronto.
- Queda de áudio na fonte. O reconhecedor não produzirá legendas para silêncio. Oriente o talento no ar a preencher em vez de esperar.
- Troca de idioma no meio da transmissão. Possível — mas introduz uma lacuna de 1–2 segundos enquanto o pipeline de tradução reaquece. Troque apenas entre segmentos.