一家新闻编辑室报道一场大多数观众听不懂语言的新闻发布会。传统解决方案:切回到演播室主持人那里,由其总结发言内容,并辅以配音翻译的片段。观众了解了大意,但那一刻——演讲者的语气、交流的节奏、即兴的追问——在总结中丢失了。
Loquira提供了一种不同的解决方案:播放原始信号,并叠加翻译字幕。观众观看原始事件。他们以与演讲者语速同步的方式,用自己的语言阅读翻译。编辑叙事就是事件本身,而不是演播室的总结。
Loquira在新闻广播流程中的位置
典型的直播事件新闻广播链路如下:
直播信号 → 信号接入 → 图形叠加 → 播出 → 分发
Loquira实时提供翻译后的文字和音频。听众视图显示翻译后的转录,可以作为手动字幕输入的参考,也可以在会话后导出为SRT或WebVTT格式,用于录制内容的字幕叠加。直接广播图形集成(浏览器源、WebSocket推送)已列入产品路线图。
延迟预算
广播机构在严格的时间限制下运作。每一帧都有预定的位置。添加翻译不能打乱这个排期。
Loquira从麦克风到翻译输出的延迟预算:
| 阶段 | 延迟 |
|---|---|
| 语音识别(Deepgram Nova-3,付费层级) | ~300毫秒 |
| 翻译(Gemini Flash) | ~250毫秒 |
| 文本转语音合成 | ~200毫秒 |
| 总端到端延迟 | ~750毫秒 |
这完全在大多数广播机构为直播活动维护的延迟缓冲区范围内(通常为3-10秒,用于法律审核和脏话延迟)。对于新闻报道、新闻发布会和直播活动广播来说,实时播出是可行的。对于每秒钟都至关重要的节目——突发新闻、现场体育赛事——延迟对观众来说是不可感知的。
编辑监督
对于需要对播出字幕进行编辑控制的新闻编辑室,字幕操作员监控Loquira听众视图并手动将翻译文本输入图形系统。这镜像了传统广播工作流程中字幕的管理方式:操作员是一个制作角色,负责时间和可见性,而不是翻译准确性。翻译准确性由引擎处理,并在活动后与源转录进行核对。
非工作语言区域的观众增长
翻译广播的商业理由在于观众覆盖范围。一个报道法语新闻发布会并配有英文字幕的新闻频道,服务于原始语言广播无法覆盖的观众。字幕就是产品——它们使内容对不懂源语言的观众可及。
活动结束后,转录可以作为辅助文章发布在新闻编辑室的网站上。文章包含广播支持的所有语言的完整翻译转录,以及带字幕的视频回放。这将内容的生命周期从直播窗口延长到了网站的存档周期。
对于国际广播机构——像France 24、DW或Al Jazeera这样已经以多种语言运营的组织——Loquira允许一个制作团队同时为所有语言频道制作内容。新闻发布会只需报道一次;每个语言频道获得自己的字幕馈送和转录,无需额外的制作开销。