Enrutamiento de audio en OBS para traducción — el patrón de captura dedicada de micrófono
Cómo enrutar tu micrófono a OBS Studio y al motor de traducción de Loquira en paralelo, sin enviar audio del juego ni sonidos del escritorio al proceso de reconocimiento. Configuración detallada para Windows (VoiceMeeter) y macOS (Loopback / BlackHole).
El error más común al añadir traducción en tiempo real a una transmisión con OBS es enviar el audio equivocado al motor de traducción. Los streamers optan por la opción más sencilla —dejar que Loquira escuche lo que sea que OBS esté reproduciendo— y la pista traducida resultante es notablemente peor de lo que debería ser. La solución es directa pero rara vez intuitiva: alimenta a Loquira con una captura dedicada del micrófono, separada de la mezcla de audio de escritorio de OBS.
Este artículo recorre el enrutamiento en detalle, con recetas concretas de configuración para Windows y macOS. Asume que ya utilizas OBS Studio para transmitir y que tienes un micrófono dedicado (USB, XLR o de solapa inalámbrico). No requiere ningún conocimiento previo de ingeniería de audio.
Por qué importa la captura dedicada de micrófono
Los modelos de reconocimiento de voz están ajustados para reconocer una voz en una señal relativamente limpia. El modelo tiene un presupuesto finito de reconocimiento: un umbral de calidad por debajo del cual su salida se degrada. Cuando la entrada es tu voz más música de fondo más un sonido de alerta de la transmisión más los pasos del juego, el modelo gasta presupuesto de reconocimiento separando esas señales. La voz sobrevive, pero con más errores de los que tendría de otro modo.
La etapa de traducción no puede recuperarse de los errores de STT. Una palabra mal reconocida en el idioma de origen se convierte en una palabra equivocada en el idioma de destino. Los oyentes experimentan esto como una pista traducida que suena como si el hablante estuviera constantemente cometiendo pequeños errores de sustitución de palabras: confuso y cada vez más fatigoso a lo largo de una sesión larga.
Alimentar a Loquira con una captura dedicada de micrófono —tu voz y solo tu voz— mantiene al motor de reconocimiento enfocado. El audio del juego, la música y las alertas van a la emisión (donde los oyentes los quieren) pero no al proceso de traducción (donde crean errores).
El mismo principio se aplica a los cambiadores de voz, pitch shifters y grandes efectos de reverberación. El motor de traducción quiere la señal seca. Los efectos pertenecen aguas abajo del punto de captura del reconocimiento, aplicados a la mezcla de emisión únicamente. Para los VTubers que usan voces de personaje con tono modificado, esto es innegociable: consulta cómo los VTubers llegan a audiencias internacionales para la configuración específica.
La forma del enrutamiento
Conceptualmente, el enrutamiento divide tu micrófono en dos rutas inmediatamente después de la captura:
Micrófono
├──→ Cadena de efectos → Mezcla de transmisión de OBS → Twitch / YouTube / etc.
└──→ Motor de traducción de Loquira
Ambas rutas ven la misma señal seca del micrófono. La ruta de transmisión añade efectos, mezcla audio del juego y aplica tu procesamiento habitual de transmisión. La ruta de traducción permanece limpia.
En un teléfono o tablet ejecutando Loquira, el micrófono es la propia entrada del dispositivo: no se necesita enrutamiento; solo posiciona el micrófono cerca de tu boca. Las complicaciones empiezan cuando Loquira se ejecuta en la misma máquina que OBS, o cuando quieres que el propio OBS alimente a Loquira para mantener tu micrófono físico dedicado a la cadena de OBS.
Hay tres patrones viables:
Patrón A — Dispositivo separado, micrófono separado. Loquira se ejecuta en un teléfono o tablet con su propio micrófono integrado o USB, posicionado junto a tu micrófono principal. Esta es la configuración más simple y evita todo el enrutamiento por completo. La desventaja es la redundancia de micrófonos: estás pagando y gestionando dos micrófonos para una voz. Para la mayoría de los creadores solitarios con un único micrófono de calidad de transmisión, este patrón es excesivo.
Patrón B — Dispositivo separado, micrófono físico compartido mediante splitter. Loquira se ejecuta en un teléfono o tablet. La señal del micrófono se divide físicamente antes de llegar a cualquiera de los dispositivos: un splitter TRRS para un lavalier, un cable Y para XLR o un hub USB con paso a través de audio. Ambos dispositivos reciben la misma señal limpia del micrófono. Este es el patrón más limpio técnicamente pero requiere hardware que varía según el tipo de micrófono. La guía de micrófonos cubre las combinaciones de hardware compatibles.
Patrón C — Misma máquina, enrutamiento de audio virtual. OBS y Loquira se ejecutan en la misma máquina. Un dispositivo de audio virtual enruta el micrófono tanto a OBS como a Loquira simultáneamente. Este es el patrón más flexible y el que la mayoría de los streamers experimentados adoptan. Requiere una utilidad de cable de audio virtual: VoiceMeeter en Windows, Loopback o BlackHole en macOS.
El resto de este artículo se centra en el Patrón C, que es la configuración más versátil y la que tiene mayor confusión de configuración.
Patrón C en Windows: VoiceMeeter Banana
VoiceMeeter Banana es la herramienta estándar para el enrutamiento de audio virtual en Windows. Es gratuita, estable y bien documentada. La versión que quieres es el nivel “Banana”: el Estándar es demasiado limitado, el Potato es excesivo.
La configuración a alto nivel:
- Instala VoiceMeeter Banana. Descárgalo desde
voicemeeter.com. Reinicia después de instalar: los dispositivos de audio virtuales se registran al arrancar. - Configura tu micrófono como Hardware Input 1. En VoiceMeeter, haz clic en el desplegable “Hardware Input 1” y selecciona tu micrófono USB o interfaz de audio.
- Configura dos salidas virtuales. Hardware Input 1 debería enrutarse tanto al bus “A1” (tu salida física de monitorización de emisión) como a la salida virtual “B1”. La ruta A1 es para la monitorización de OBS; la ruta B1 es el cable virtual a Loquira.
- Configura Loquira para escuchar a VoiceMeeter B1. Cuando Loquira pida un dispositivo de entrada de audio, selecciona “VoiceMeeter Out B1” (la etiqueta exacta varía ligeramente según la versión de Loquira).
- Configura OBS para escuchar directamente a Hardware Input 1 O a VoiceMeeter B1. Ambos funcionan; la ruta directa tiene menor latencia, la ruta de VoiceMeeter te permite aplicar efectos en VoiceMeeter y que tanto OBS como la emisión capten la versión con efectos mientras dejas B1 limpio si lo tienes en un bus separado.
El detalle crítico: mantén limpio el bus que va a Loquira. Sin efectos, sin entradas auxiliares, solo la señal seca del micrófono. Los efectos pertenecen a un bus de VoiceMeeter separado que alimenta solo a OBS.
Si eres nuevo en VoiceMeeter, la interfaz parece intimidante: un panel con muchos mandos y conmutadores de enrutamiento. La distribución de 3 tiras es realmente simple una vez que sabes qué es cada tira: Hardware Input 1, 2, 3 son entradas físicas; Virtual Inputs 1, 2 son audio de software (p. ej., Discord, Spotify); los buses A1, A2, A3 son salidas físicas; B1, B2 son salidas virtuales. El enrutamiento se basa en casillas de verificación: haz clic en el indicador “B1” en Hardware Input 1 para enviar tu micrófono a la salida virtual B1. Ese es todo el concepto.
Patrón C en macOS: Loopback o BlackHole
macOS tiene dos opciones principales. Loopback (Rogue Amoeba) es de pago (~$120 una sola vez) y más capaz. BlackHole es gratuito, de código abierto y adecuado para el patrón de captura dedicada. Cualquiera funciona.
Configuración de Loopback:
- Instala e inicia Loopback. Crea un nuevo dispositivo virtual; llámalo “Loquira Mic Route”.
- Añade tu micrófono como la fuente. Haz clic en el ”+” junto a “Sources” y elige tu micrófono físico o interfaz de audio.
- Confirma que los canales son mono o estéreo según los proporcione tu micrófono. La mayoría de los micrófonos son mono; deja que Loopback enrute mono dentro, mono fuera.
- Loopback ahora es visible en todo el sistema como un dispositivo de audio virtual. En Loquira, selecciona “Loquira Mic Route” como entrada de audio. En OBS, sigue escuchando directamente tu micrófono físico: no hay necesidad de enrutar OBS a través de Loopback a menos que también quieras aplicar efectos en la cadena de procesamiento de Loopback.
Configuración de BlackHole:
BlackHole es más primitivo: crea un único dispositivo de audio virtual del que cualquier app puede leer y al que puede escribir, pero no tiene la UI de enrutamiento de Loopback. El patrón estándar es:
- Instala BlackHole 2ch. Descárgalo desde
existential.audio/blackhole. Reinicia después de instalar. - Crea un Multi-Output Device en Audio MIDI Setup. Abre
/Applications/Utilities/Audio MIDI Setup.app, haz clic en el ”+” de abajo a la izquierda, elige “Create Multi-Output Device”. Añade tanto tu micrófono físico como BlackHole 2ch al dispositivo. - Espera: BlackHole 2ch es una salida, no una entrada. El enfoque Multi-Output funciona para el caso inverso (enviar la salida de una app a múltiples destinos). Para el caso de división de entrada que quieres, necesitas un “Aggregate Device” en su lugar, o puedes enrutar de forma diferente: que OBS escuche el micrófono directamente, y que Loquira escuche BlackHole 2ch con una pequeña utilidad (o simplemente Audio Hijack de Rogue Amoeba) enviando el micrófono a BlackHole.
En la práctica, en macOS, Loopback merece la pena los $120 para streamers que quieren una configuración limpia del Patrón C. BlackHole está bien si te manejas con Core Audio y no te importa una configuración más manual.
Configuración del lado de OBS
Dentro de OBS, tus fuentes deberían verse así:
- Fuente de micrófono 1: micrófono físico (directo). Esto es lo que la emisión escucha. Aplica efectos (compresión, puerta de ruido, EQ) en esta fuente.
- Audio Monitoring (en OBS settings → Audio). Usa esto solo si necesitas oírte en tus auriculares. No actives Monitor Only en la fuente de micrófono: eso la desconecta de la emisión.
No necesitas una fuente OBS separada para el audio dirigido a Loquira. Loquira lee del dispositivo de audio virtual directamente, fuera de OBS. OBS no necesita saber que Loquira existe.
Un error común: añadir una fuente de audio “Loquira” en OBS para “asegurarse de que la traducción está en la emisión.” Esto es incorrecto por dos razones. Primero, el audio traducido de Loquira se entrega a los oyentes a través de la app de Loquira o el enlace de unión, no a través de la emisión: no hay audio traducido que capturar desde Loquira de vuelta a OBS. Segundo, el audio en idioma original ya está en OBS vía tu fuente de micrófono; añadir una segunda copia crea un eco.
Verificar el enrutamiento
Tras la configuración, ejecuta una sesión de prueba corta antes de salir en vivo. La ruta de audio que quieres verificar:
- Inicia una sesión de Loquira. Abre la app o la interfaz web de Loquira en la máquina de transmisión.
- Confirma el dispositivo de entrada. Debería ser el dispositivo de audio virtual (VoiceMeeter B1 en Windows, Loopback / BlackHole en macOS), no el micrófono físico.
- Habla durante ~30 segundos a volumen normal. Observa la transcripción de reconocimiento. Debería captar tus palabras con limpieza.
- Reproduce audio del juego o música de fondo. La transcripción de reconocimiento no debería mostrar transcripción del audio del juego. Si lo hace, tu enrutamiento es incorrecto: Loquira está captando la mezcla del escritorio en lugar de solo tu micrófono.
- Compara con OBS. OBS debería estar captando tu voz más el audio del juego (o cualquiera que sea tu mezcla de stream normal). Ambas rutas están recibiendo lo que deberían.
Si el paso 4 falla, la causa más común en Windows es que VoiceMeeter está enrutando demasiado a B1: revisa el indicador B1 en cada tira de entrada y asegúrate de que solo Hardware Input 1 (tu micrófono) está activado, no Virtual Input 1 (que captura el audio del escritorio).
Consideraciones de latencia
El enrutamiento de captura dedicada no añade latencia significativa al proceso de traducción. VoiceMeeter y Loopback funcionan ambos con ~5–15 ms de latencia interna; el propio proceso de traducción añade 350–1000 ms dependiendo del par de idiomas. El enrutamiento es un error de redondeo comparado con el proceso.
Esto importa para dos casos específicos:
- Streamers que hacen lipsync con música. Si tu monitorización de emisión va a través del cable virtual en lugar de directa, te oirás ligeramente retrasado en tus auriculares. Mantén la monitorización en la ruta directa del micrófono, no a través del cable virtual.
- Indicaciones de voz en juego competitivo. La latencia de traducción es de 0,5–1,0 segundos independientemente del enrutamiento. Para contextos competitivos esto es demasiado alto: consulta presupuesto de latencia para la traducción de transmisiones en vivo para la discusión más extensa.
¿Y Loquira basado en teléfono y OBS juntos?
Si prefieres mantener Loquira en un teléfono o tablet (Patrón A o B) y OBS en el PC de transmisión, la cuestión del enrutamiento se simplifica drásticamente. El teléfono tiene su propio micrófono (Patrón A) o divide el micrófono físico con un splitter TRRS / XLR / USB-audio (Patrón B). No se necesitan cables de audio virtuales.
Esta es la configuración con la que muchos streamers nuevos empiezan, y es perfectamente válida. Las razones por las que los creadores se mueven al Patrón C con el tiempo suelen ser: querer que los efectos de audio del lado de OBS se apliquen a la emisión sin aplicarse a la traducción (el Patrón C los separa limpiamente), querer un dispositivo menos en el escritorio o querer portabilidad más fácil entre equipos.
¿Y los filtros de audio propios de OBS?
OBS tiene filtros de audio integrados: puerta de ruido, compresor, EQ. ¿Deberías aplicarlos a la fuente del micrófono antes de enviar el audio a Loquira?
La respuesta es: no los apliques en la ruta a Loquira. Aplícalos solo en la ruta de emisión. El motor de reconocimiento de Loquira tiene su propia supresión de ruido ajustada para el reconocimiento de voz; la puerta de ruido de OBS puede recortar los inicios de palabras si se ajusta de forma demasiado agresiva, dañando el reconocimiento. La compresión puede aplanar la dinámica de formas que no ayudan al reconocimiento. La EQ está bien con moderación pero no debería realzar fuertemente frecuencias por encima de 8 kHz (el reconocimiento se ajusta para el rango vocal de 100 Hz–6 kHz).
Con el Patrón C y un bus de cable virtual separado, esto es automático: los filtros de OBS se aplican a la fuente de OBS (la ruta de emisión) y el bus del cable de Loquira queda intacto.
La receta resumen
Para la mayoría de los streamers de OBS con un micrófono dedicado:
- Instala una utilidad de cable de audio virtual (VoiceMeeter Banana en Windows, Loopback en macOS).
- Configura la utilidad para reflejar tu micrófono a una salida virtual desde la que Loquira pueda leer.
- Configura el dispositivo de entrada de Loquira a esa salida virtual. Confirma que Loquira oye solo tu voz, no el audio del escritorio.
- Deja la fuente de micrófono de OBS en el micrófono físico directamente. Aplica efectos de emisión (puerta, compresión, EQ) en esta fuente.
- Ejecuta una sesión de prueba de 30 segundos con audio del juego reproduciéndose de fondo. Confirma que la transcripción de Loquira muestra solo tu voz.
Esa es toda la configuración. Una vez configurada, persiste entre transmisiones: no la reconfiguras en cada sesión. La guía de integración con la plataforma OBS Studio cubre el lado específico de la app de Loquira para la configuración; este artículo cubre el lado del enrutamiento de audio.
Combinadas, son la forma más limpia de añadir traducción en tiempo real a una transmisión basada en OBS sin comprometer la calidad de emisión ni de traducción.
¿Quieres probarlo? Inicia una sesión gratuita — habla en cualquiera de 49 idiomas, tu audiencia escucha en 225. Sin configuración, sin tarjeta de crédito.