Osadź napisy na żywo w transmisji
Wprowadzanie przetłumaczonych napisów do potoku grafiki broadcastu używając wyjścia tłumaczenia Loquira.
Broadcasterzy chcą napisy — czyste, przetłumaczone i przybywające w tym samym potoku grafiki który obsługuje dolne trzecie i tickery. Ten przewodnik obejmuje charakterystyki latencji potoku tłumaczenia Loquira i jak pracować z jego wyjściem dzisiaj.
Budżet latencji
Broadcasterzy działają w ramach ścisłych ograniczeń czasowych. Każda klatka ma zaplanowaną pozycję. Zrozumienie end-to-end latencji Loquira pomaga planować umieszczenie napisów w stosie broadcastu.
| Etap | Latencja |
|---|---|
| Rozpoznawanie mowy (Deepgram Nova-3) | ~300 ms |
| Tłumaczenie (Gemini) | ~250 ms |
| Synteza mowy na tekst | ~200 ms |
| Suma end-to-end | ~750 ms |
To jest dobrze w ramach bufora opóźnienia który większość broadcasterów utrzymuje dla wydarzeń na żywo (typowo 3–10 sekund dla recenzji prawnych i opóźnienia przekleństw). Trasa live-to-air jest realistyczna dla pokrycia newsowego, konferencji prasowych i broadcastu wydarzeń na żywo.
Praca z przetłumaczonym wyjściem dzisiaj
Widok słuchacza Loquira wyświetla przetłumaczony tekst i audio w czasie rzeczywistym. Dla integracji broadcast, dostępne są obecnie dwie podejścia:
Nakładka napisów po-sesji. Po zakończeniu sesji wyeksportuj transkrypt w formacie SRT lub WebVTT. Zaimportuj plik do systemu edycji lub odtwarzania aby wypalić napisy do nagranego broadcastu. To jest najbardziej niezawodna metoda i działa z dowolnym potokiem grafiki.
Widok słuchacza jako odniesienie. Otwórz widok publiczności Loquira na dedykowanym urządzeniu i umieść go poza ekranem. Operator napisów ogląda przetłumaczony tekst i wprowadza napisy ręcznie do systemu grafiki. To wprowadza ludzką latencję ale daje pełną kontrolę redakcyjną nad czasem i widocznością.
Bezpośrednia integracja feedu napisów do systemów grafiki broadcast (OBS, vMix, CasparCG) jest na mapie drogowej produktu.
Tryby awarii do zaplanowania
- Utrata sieci na urządzeniu prezentera. Tłumaczenie zatrzymuje się natychmiast. Mieć zapasową grafikę (“Tłumaczenie na żywo tymczasowo niedostępne”) gotową.
- Utrata audio na źródle. Rozpoznawacz nie wyprodukuje napisów dla ciszy. Poinstruuj talent na antybie aby wypełnić zamiast czekać.
- Zmiana języka w trakcie broadcastu. Możliwe — ale wprowadza lukę 1–2 sekundy gdy potok tłumaczenia się ponownie rozgrzewa. Przełączaj tylko między segmentami.