翻訳のためのOBSオーディオルーティング — 専用マイクキャプチャパターン
マイクをOBS StudioとLoquira翻訳エンジンに並列でルーティングする方法。ゲーム音声やデスクトップサウンドを認識パイプラインに送り込まずに行います。Windows(VoiceMeeter)とmacOS(Loopback/BlackHole)の詳細なセットアップ。
OBS配信にライブ翻訳を追加する際の最もよくある失敗は、翻訳エンジンに間違ったオーディオを送り込むことです。配信者は最もシンプルな選択肢、すなわちOBSが再生しているものは何でもLoquiraに聞かせる方法に手を伸ばし、結果として生じる翻訳トラックは本来あるべき品質より明らかに悪くなります。修正は単純ですが直感的ではないことが多いです。OBSのデスクトップオーディオミックスから分離された、専用のマイクキャプチャをLoquiraに供給することです。
本記事はルーティングを詳しく順を追って説明し、WindowsとmacOSのための具体的なセットアップレシピを示します。すでに配信にOBS Studioを使用し、専用マイク(USB、XLR、またはワイヤレスラベリア)を持っていることを前提とします。オーディオエンジニアリングのバックグラウンドは必要ありません。
なぜ専用マイクキャプチャが重要か
音声認識モデルは比較的クリーンな信号の中で1つの声を認識するよう調整されています。モデルには有限の認識バジェットがあります。出力が劣化する品質閾値です。入力があなたの声+バックグラウンドミュージック+配信アラート音+ゲームの足音である場合、モデルはそれらの信号を分離するために認識バジェットを消費します。声は生き残りますが、そうでない場合より多くのエラーを伴います。
翻訳ステージはSTTエラーから回復できません。ソース言語で誤認識された単語は、ターゲット言語で間違った単語になります。リスナーはこれを、話者が絶えず小さな単語置換ミスをしているように聞こえる翻訳トラックとして体験します。長いセッション全体にわたって紛らわしく、ますます疲労を生みます。
Loquiraに専用マイクキャプチャ、つまりあなたの声、ただあなたの声のみを供給することで、認識エンジンの集中を保てます。ゲーム音声、音楽、アラートは放送(リスナーが望む場所)へ行きますが、翻訳パイプライン(エラーを生む場所)へは行きません。
同じ原則がボイスチェンジャー、ピッチシフター、大きなリバーブエフェクトに当てはまります。翻訳エンジンはドライ信号を必要とします。エフェクトは認識タップの下流に属し、放送ミックスのみに適用されます。ピッチシフトされたキャラクター音声を使うVTuberにとって、これは非交渉です。具体的なセットアップについてはVTuberが海外オーディエンスに届く方法をご覧ください。
ルーティングのかたち
概念的には、ルーティングはキャプチャ直後にあなたのマイクを2つの経路に分割します。
Microphone
├──→ Effects chain → OBS broadcast mix → Twitch / YouTube / etc.
└──→ Loquira translation engine
両方の経路が同じドライマイク信号を見ます。放送経路はエフェクトを追加し、ゲーム音声をミックスし、通常の放送処理を適用します。翻訳経路はクリーンなままです。
Loquiraを動かしているスマートフォンやタブレットでは、マイクはデバイスの内蔵入力です。ルーティングは不要で、マイクを口の近くに配置するだけです。LoquiraがOBSと同じマシンで動くか、物理マイクをOBSのチェーンに専用とするためにOBS自体にLoquiraを供給したい場合に、複雑さが始まります。
実用的なパターンは3つあります:
パターンA — 別デバイス、別マイク。 Loquiraがスマートフォンまたはタブレットで独自の内蔵またはUSBマイクと共に動作し、メインマイクの隣に配置されます。これは最もシンプルなセットアップで、ルーティングを完全に回避します。欠点はマイクの冗長性です。1つの声に対して2つのマイクを支払い管理することになります。専用の放送品質マイクを1つ持つほとんどのソロクリエイターにとって、このパターンは過剰です。
パターンB — 別デバイス、スプリッター経由で共有された物理マイク。 Loquiraがスマートフォンまたはタブレットで動作します。マイク信号はどちらかのデバイスに到達する前に物理的に分割されます。ラベリアにはTRRSスプリッター、XLRにはYケーブル、または音声パススルー付きUSBハブを使います。両方のデバイスが同じクリーンなマイク信号を受け取ります。これは技術的に最もクリーンなパターンですが、マイクタイプによって異なるハードウェアを必要とします。マイクガイドで互換性のあるハードウェアの組み合わせを扱っています。
パターンC — 同じマシン、仮想オーディオルーティング。 OBSとLoquiraが同じマシンで動作します。仮想オーディオデバイスがマイクをOBSとLoquiraの両方に同時にルーティングします。これは最も柔軟なパターンであり、ほとんどの経験豊富な配信者が落ち着くものです。仮想オーディオケーブルユーティリティが必要です。Windowsには VoiceMeeter、macOSにはLoopbackまたはBlackHoleです。
本記事の残りはパターンCに焦点を当てます。最も汎用的なセットアップであり、セットアップの混乱が最も多いものでもあります。
Windowsでのパターン C:VoiceMeeter Banana
VoiceMeeter BananaはWindowsでの仮想オーディオルーティングの標準ツールです。無料、安定、ドキュメントが充実しています。欲しいバージョンは「Banana」階層です。Standardは制限が強すぎ、Potatoは過剰です。
高レベルのセットアップ:
- VoiceMeeter Bananaをインストールする。
voicemeeter.comからダウンロードします。インストール後に再起動します。仮想オーディオデバイスはブート時に登録されます。 - マイクをHardware Input 1として構成する。 VoiceMeeterで「Hardware Input 1」ドロップダウンをクリックし、USBマイクまたはオーディオインターフェースを選択します。
- 2つの仮想出力をセットアップする。 Hardware Input 1は「A1」バス(物理的放送モニタリング出力)と「B1」仮想出力の両方にルーティングすべきです。A1経路はOBSモニタリング用、B1経路はLoquiraへの仮想ケーブルです。
- LoquiraをVoiceMeeter B1を聞くように構成する。 Loquiraがオーディオ入力デバイスを求めるとき、「VoiceMeeter Out B1」(正確なラベルはLoquiraバージョンによってわずかに異なります)を選択します。
- OBSをHardware Input 1を直接、またはVoiceMeeter B1を聞くように構成する。 どちらでも動作します。直接経路はレイテンシが低く、VoiceMeeter経路はVoiceMeeterでエフェクトを適用してOBSと放送の両方がエフェクト適用済みバージョンを拾えるようにしつつ、別バスにあればB1をクリーンに保てます。
クリティカルな詳細:Loquiraに行くバスをクリーンに保つこと。エフェクトなし、補助入力なし、ただドライマイク信号だけです。エフェクトはOBSのみに供給する別のVoiceMeeterバスに属します。
VoiceMeeterに新しい場合、インターフェースは威圧的に見えます。多くのつまみとルーティングスイッチがあるボードです。3ストリップレイアウトは、各ストリップが何かを知れば実は単純です。Hardware Input 1、2、3は物理入力、Virtual Inputs 1、2はソフトウェアオーディオ(例:Discord、Spotify)、バスA1、A2、A3は物理出力、B1、B2は仮想出力です。ルーティングはチェックボックスベースです。マイクをB1仮想出力に送るには、Hardware Input 1の「B1」インジケータをクリックします。それが概念のすべてです。
macOSでのパターン C:LoopbackまたはBlackHole
macOSには2つの主要オプションがあります。Loopback(Rogue Amoeba)は有料(約$120の買い切り)で、より高機能です。BlackHoleは無料、オープンソースで、専用キャプチャパターンには適切です。どちらでも動作します。
Loopbackセットアップ:
- Loopbackをインストールして起動する。 新しい仮想デバイスを作成します。「Loquira Mic Route」と呼びましょう。
- マイクをソースとして追加する。 「Sources」の隣の「+」をクリックし、物理マイクまたはオーディオインターフェースを選択します。
- チャンネルがマイクの提供する通りモノまたはステレオであることを確認する。 ほとんどのマイクはモノです。Loopbackにモノ入り、モノ出をルーティングさせます。
- Loopbackはシステム全体で仮想オーディオデバイスとして表示される。 Loquiraで「Loquira Mic Route」をオーディオ入力として選択します。OBSでは物理マイクを直接聞き続けます。Loopbackの処理チェーンでエフェクトを適用したい場合を除いて、OBSをLoopback経由でルーティングする必要はありません。
BlackHoleセットアップ:
BlackHoleはより原始的です。任意のアプリが読み書きできる単一の仮想オーディオデバイスを作成しますが、LoopbackのルーティングUIはありません。標準パターンは次のとおりです:
- BlackHole 2chをインストールする。
existential.audio/blackholeからダウンロードします。インストール後に再起動します。 - Audio MIDI Setupでマルチ出力デバイスを作成する。
/Applications/Utilities/Audio MIDI Setup.appを開き、左下の「+」をクリックし、「マルチ出力デバイスの作成」を選択します。物理マイクとBlackHole 2chの両方をデバイスに追加します。 - 待って — BlackHole 2chは入力ではなく出力です。 マルチ出力アプローチは逆のケース(1つのアプリの出力を複数の宛先に送る)に機能します。望ましい入力分割ケースには代わりに「集約デバイス」が必要、または異なるルーティングが可能:OBSにマイクを直接聞かせ、Loquiraに小さなユーティリティ(またはRogue AmoebaのAudio Hijack)でマイクをBlackHoleに送ったBlackHole 2chを聞かせます。
実際には、macOSでは、クリーンなパターンCセットアップを望む配信者にとってLoopbackは$120の価値があります。BlackHoleはCore Audioに慣れていて、より手動のセットアップを気にしないなら問題ありません。
OBS側の構成
OBS内では、ソースは次のようになるべきです:
- マイクソース1:物理マイク(直接)。 これが放送が聞くものです。このソースにエフェクト(コンプレッション、ノイズゲート、EQ)を適用します。
- 音声モニタリング(OBS設定→音声)。 ヘッドホンで自分の声を聞く必要がある場合にのみこれを使います。マイクソースで「モニターのみ」を有効にしないでください。それは放送から切断します。
Loquira用オーディオに別のOBSソースは必要ありません。LoquiraはOBSの外で仮想オーディオデバイスから直接読みます。OBSはLoquiraの存在を知る必要はありません。
よくある失敗:「翻訳が放送に入っていることを確認する」ためにOBSに「Loquira」オーディオソースを追加すること。これは2つの点で間違っています。第一に、Loquiraの翻訳音声はLoquiraアプリまたは参加リンクを通してリスナーに届けられ、放送を通してではありません。OBSに戻してキャプチャする翻訳音声はありません。第二に、元言語音声はマイクソースを介してすでにOBSにあります。2つ目のコピーを追加するとエコーが発生します。
ルーティングの検証
セットアップ後、本番配信前に短いテストセッションを実行してください。検証したいオーディオ経路:
- Loquiraセッションを開始する。 配信マシンでLoquiraアプリまたはWebインターフェースを開きます。
- 入力デバイスを確認する。 物理マイクではなく、仮想オーディオデバイス(WindowsではVoiceMeeter B1、macOSではLoopback/BlackHole)であるべきです。
- 通常の音量で約30秒話す。 認識文字起こしを観察します。あなたの言葉をクリーンに拾うべきです。
- バックグラウンドでゲーム音声または音楽を再生する。 認識文字起こしはゲーム音声の文字起こしを示すべきではありません。示すなら、ルーティングが間違っています。Loquiraはマイクだけではなくデスクトップミックスを拾っています。
- OBSと比較する。 OBSはあなたの声に加えてゲーム音声(または通常の配信ミックス)を拾っているべきです。両方の経路が受け取るべきものを受け取っています。
ステップ4が失敗する場合、Windowsで最もよくある原因は、VoiceMeeterがB1にルーティングしすぎていることです。各入力ストリップのB1インジケータを確認し、Hardware Input 1(マイク)のみが有効で、Virtual Input 1(デスクトップ音声をキャプチャ)が有効でないことを確認してください。
レイテンシの考慮
専用キャプチャルーティングは翻訳パイプラインに意味のあるレイテンシを加えません。VoiceMeeterとLoopbackは両方とも約5〜15msの内部レイテンシで動作します。翻訳パイプライン自体は言語ペアに応じて350〜1000msを加えます。ルーティングはパイプラインと比べると丸め誤差です。
これは2つの特定のケースで重要です:
- 音楽にリップシンクする配信者。 放送モニタリングが直接ではなく仮想ケーブルを通る場合、ヘッドホンで自分の声がわずかに遅れて聞こえます。モニタリングは仮想ケーブルではなく直接マイク経路に保ってください。
- 競技ゲームの音声コールアウト。 翻訳レイテンシはルーティングに関わらず0.5〜1.0秒です。競技コンテクストではこれは高すぎます。より長い議論についてはライブ配信翻訳のレイテンシバジェットをご覧ください。
スマートフォンベースのLoquiraとOBSを一緒に使うのは?
LoquiraをスマートフォンまたはタブレットでOBSを配信PCに保ちたい場合(パターンAまたはB)、ルーティングの問題は劇的に単純化します。スマートフォンは独自のマイクを持っているか(パターンA)、TRRS/XLR/USBオーディオスプリッターで物理マイクを分割します(パターンB)。仮想オーディオケーブルは不要です。
これは多くの新しい配信者が始めるセットアップであり、完全に問題ありません。クリエイターが時間とともにパターンCに移行する理由は通常:OBS側のオーディオエフェクトを翻訳に適用せずに放送に適用したい(パターンCはそれらをきれいに分離します)、デスク上のデバイスを1つ減らしたい、または機材間のポータビリティを容易にしたい、です。
OBS自身のオーディオフィルターは?
OBSには組み込みオーディオフィルター、ノイズゲート、コンプレッサー、EQがあります。Loquiraにオーディオを送る前にマイクソースに適用すべきでしょうか?
答えは:Loquiraへの経路には適用しないでください。放送経路のみに適用します。Loquiraの認識エンジンは音声認識用にチューニングされた独自のノイズ抑制を持っています。OBSノイズゲートは積極的すぎる設定では単語の始まりをクリップする可能性があり、認識を損ないます。コンプレッションは認識を助けない方法でダイナミクスを平坦化できます。EQは控えめなら問題ありませんが、8kHz以上の周波数を強く上げるべきではありません(認識は100Hz〜6kHzのボーカル範囲にチューニングされています)。
パターンCと別の仮想ケーブルバスでは、これは自動的です。OBSのフィルターはOBSソース(放送経路)に適用され、Loquiraケーブルバスは触られません。
まとめレシピ
専用マイクを持つほとんどのOBS配信者向け:
- 仮想オーディオケーブルユーティリティをインストールする(WindowsではVoiceMeeter Banana、macOSではLoopback)。
- マイクを仮想出力にミラーするようユーティリティを構成する、Loquiraが読めるように。
- Loquiraの入力デバイスをその仮想出力に設定する。 Loquiraがあなたの声のみを聞き、デスクトップ音声を聞かないことを確認します。
- OBSのマイクソースは物理マイクを直接にしておく。 放送エフェクト(ゲート、コンプレッション、EQ)はこのソースに適用します。
- バックグラウンドでゲーム音声を再生しながら30秒のテストセッションを実行する。 Loquiraの文字起こしがあなたの声だけを示すことを確認します。
これがセットアップの全てです。一度構成すれば配信間で永続します。各セッションで再構成しません。OBS Studioプラットフォーム統合ガイドは構成のLoquiraアプリ側の具体を扱っています。本記事はオーディオルーティング側を扱っています。
組み合わせると、放送品質または翻訳品質を損なうことなくOBSベースの配信にライブ翻訳を追加する最もクリーンな方法です。
試してみたいですか?無料セッションを開始 — 49言語のいずれかで話すと、聴衆は225言語で聞くことができます。設定不要、クレジットカード不要。