प्रसारण में लाइव कैप्शन एम्बेड करें
Loquira के अनुवाद आउटपुट का उपयोग करके एक प्रसारण ग्राफिक्स पाइपलाइन में अनुवादित कैप्शन लाना।
प्रसारकों को कैप्शन चाहिए — साफ, अनुवादित, और उसी ग्राफिक्स पाइपलाइन में आने वाले जो लोअर-थर्ड्स और टिकर्स को संभालते हैं। यह गाइड Loquira के अनुवाद पाइपलाइन के विलंब विशेषताओं को कवर करता है और आज इसके आउटपुट के साथ कैसे काम करें।
विलंब बजट
प्रसारक सख्त समय बाधाओं के भीतर काम करते हैं। हर फ्रेम की एक निर्धारित स्थिति होती है। Loquira के एंड-टू-एंड विलंब को समझने से प्रसारण स्टैक में कैप्शन प्लेसमेंट की योजना बनाने में मदद मिलती है।
| चरण | विलंब |
|---|---|
| भाषण पहचान (Deepgram Nova-3) | ~300 ms |
| अनुवाद (Gemini) | ~250 ms |
| टेक्स्ट-टू-स्पीच संश्लेषण | ~200 ms |
| कुल एंड-टू-एंड | ~750 ms |
यह अधिकांश प्रसारकों द्वारा लाइव इवेंट्स के लिए बनाए गए विलंब बफर (आमतौर पर कानूनी समीक्षा और अश्लीलता विलंब के लिए 3-10 सेकंड) के भीतर अच्छी तरह से है। समाचार कवरेज, प्रेस कॉन्फ्रेंस, और लाइव इवेंट प्रसारण के लिए एक लाइव-टू-एयर रूट यथार्थवादी है।
आज अनुवादित आउटपुट के साथ काम करना
Loquira का श्रोता दृश्य वास्तविक समय में अनुवादित पाठ और ऑडियो प्रदर्शित करता है। प्रसारण एकीकरण के लिए, वर्तमान में दो दृष्टिकोण उपलब्ध हैं:
पोस्ट-सेशन कैप्शन ओवरले। सत्र समाप्त होने के बाद, SRT या WebVTT प्रारूप में ट्रांसक्रिप्ट निर्यात करें। रिकॉर्ड किए गए प्रसारण में कैप्शन जलाने के लिए फ़ाइल को अपनी संपादन या प्लेआउट सिस्टम में आयात करें। यह सबसे विश्वसनीय विधि है और किसी भी ग्राफिक्स पाइपलाइन के साथ काम करती है।
संदर्भ के रूप में श्रोता दृश्य। एक समर्पित डिवाइस पर Loquira दर्शक दृश्य खोलें और इसे स्क्रीन से बाहर स्थित करें। एक कैप्शन ऑपरेटर अनुवादित पाठ देखता है और ग्राफिक्स सिस्टम में मैन्युअल रूप से कैप्शन दर्ज करता है। यह मानव विलंब प्रस्तुत करता है लेकिन समय और दृश्यता पर पूर्ण संपादकीय नियंत्रण प्रदान करता है।
प्रसारण ग्राफिक्स सिस्टम (OBS, vMix, CasparCG) में प्रत्यक्ष कैप्शन फीड एकीकरण उत्पाद रोडमैप पर है।
योजना बनाने के लिए विफलता मोड
- प्रेजेंटर डिवाइस पर नेटवर्क हानि। अनुवाद तुरंत रुक जाता है। एक फ़ॉलबैक ग्राफिक (“लाइव अनुवाद अस्थायी रूप से अनुपलब्ध है”) तैयार रखें।
- स्रोत पर ऑडियो ड्रॉपआउट। पहचानकर्ता चुप्पी के लिए कैप्शन नहीं बनाएगा। ऑन-एयर प्रतिभा को प्रतीक्षा करने के बजाय भरने के लिए संक्षिप्त करें।
- मध्य-प्रसारण में भाषा स्विचिंग। संभव है — लेकिन जैसे ही अनुवाद पाइपलाइन फिर से गर्म होती है यह 1-2 सेकंड का अंतर प्रस्तुत करता है। केवल खंडों के बीच स्विच करें।