Nhúng phụ đề trực tiếp trong phát sóng
Đưa phụ đề đã dịch vào quy trình đồ họa phát sóng sử dụng đầu ra dịch thuật của Loquira.
Các nhà phát sóng luôn muốn có phụ đề — sạch sẽ, được dịch chính xác và xuất hiện trong cùng quy trình đồ họa xử lý thông tin góc dưới màn hình (lower-thirds) và dải chữ chạy tin tức (tickers). Hướng dẫn này giới thiệu các đặc tính về độ trễ của quy trình dịch thuật Loquira và cách làm việc với đầu ra phụ đề của nó ở thời điểm hiện tại.
Ngân sách độ trễ
Các nhà phát sóng hoạt động dưới những ràng buộc thời gian cực kỳ nghiêm ngặt. Mỗi khung hình đều có một vị trí lịch trình cố định. Việc hiểu rõ độ trễ từ đầu đến cuối (end-to-end) của Loquira sẽ giúp lập kế hoạch phân bổ vị trí phụ đề trong ngăn xếp phát sóng một cách hợp lý.
| Giai đoạn | Độ trễ |
|---|---|
| Nhận dạng giọng nói (Deepgram Nova-3) | ~300 ms |
| Dịch thuật (Gemini) | ~250 ms |
| Tổng hợp văn bản thành giọng nói (TTS) | ~200 ms |
| Tổng độ trễ từ đầu đến cuối | ~750 ms |
Độ trễ này hoàn toàn nằm trong bộ đệm trễ mà hầu hết các nhà phát sóng duy trì cho các sự kiện trực tiếp (thường là từ 3–10 giây để kiểm duyệt nội dung nhạy cảm, thô tục và xem xét pháp lý). Việc truyền tải phụ đề trực tiếp là hoàn toàn khả thi đối với các chương trình tin tức, họp báo và phát sóng sự kiện trực tiếp.
Cách làm việc với đầu ra dịch thuật hiện nay
Chế độ người nghe của Loquira hiển thị văn bản và phát âm thanh đã dịch theo thời gian thực. Đối với tích hợp phát sóng, hiện tại có sẵn hai cách tiếp cận:
Chèn phụ đề sau buổi phát sóng. Sau khi buổi phát sóng kết thúc, bạn có thể xuất bản phụ đề ở định dạng SRT hoặc WebVTT. Nhập tệp này vào hệ thống chỉnh sửa hoặc phát sóng của bạn để ghi đè phụ đề vào bản ghi phát sóng. Đây là phương pháp đáng tin cậy nhất và hoạt động tốt với mọi quy trình sản xuất đồ họa.
Sử dụng chế độ người nghe làm tài liệu tham khảo. Mở chế độ khán giả của Loquira trên một thiết bị chuyên dụng và đặt ngoài màn hình chính. Kỹ thuật viên phụ đề sẽ theo dõi văn bản đã dịch và nhập phụ đề thủ công vào hệ thống đồ họa. Phương pháp này tạo ra độ trễ do thao tác của con người nhưng cho phép kiểm soát biên tập toàn diện về mặt thời gian và hiển thị.
Tích hợp trực tiếp luồng phụ đề vào các hệ thống đồ họa phát sóng (OBS, vMix, CasparCG) hiện đang nằm trong lộ trình phát triển sản phẩm.
Các kịch bản lỗi cần lên phương án dự phòng
- Mất mạng trên thiết bị của người trình bày. Quá trình dịch thuật sẽ dừng lại ngay lập tức. Hãy chuẩn bị sẵn một đồ họa dự phòng (ví dụ: “Dịch trực tiếp tạm thời không khả dụng”).
- Mất tín hiệu âm thanh (dropout) tại nguồn. Bộ nhận dạng sẽ không tạo ra phụ đề cho những khoảng lặng. Hãy hướng dẫn phát thanh viên/MC đang lên hình (on-air) tiếp tục nói để lấp đầy khoảng lặng thay vì chờ đợi phụ đề.
- Chuyển đổi ngôn ngữ giữa buổi phát sóng. Tính năng này khả thi — nhưng sẽ tạo ra khoảng trống từ 1–2 giây trong khi quy trình dịch thuật khởi động lại. Bạn chỉ nên thực hiện chuyển đổi ngôn ngữ giữa các phân đoạn chương trình.