🎙️Productivity

Transcripción y subtítulos en directo

Your Office AI puede transcribir llamadas en el servidor en tiempo real — ofreciendo subtítulos en directo con traducción opcional durante la llamada, y transcripciones con búsqueda posteriormente que la IA puede usar como contexto, todo bajo una política de acceso que tú controlas.

🗣️Habla en una llamadaEn una llamada de espacio de trabajo
🎙️Agente STTWhisper / OpenAI / Cloud
📝TranscripciónSubtítulos en directo + texto guardado
🤖Contexto RAG para la IAFiltrado por acceso, citado
De palabras habladas a contexto de IA — capturado, transcrito, guardado y habilitado para búsqueda para el asistente.

Elegir una canalización

Un administrador de la organización selecciona la canalización de transcripción. Hay tres opciones, con la transcripción desactivada por defecto:

CanalizaciónQué esIdeal para
Ninguna predeterminadoLa transcripción está desactivada. No se producen subtítulos ni transcripciones.Organizaciones que no necesitan transcripción
LiveKit CloudLa transcripción se ejecuta en LiveKit Cloud y llega a través de un webhook.La más rápida de activar — sin servidores que ejecutar
AutoalojadaUn agente de transcripción se ejecuta en tu propia infraestructura.Equipos que mantienen el audio en sus propios servidores
ℹ️
La transcripción es opcional

Las nuevas organizaciones comienzan con la transcripción establecida en Ninguna. Un administrador activa una canalización desde los ajustes de la Organización. Cuando una canalización está activa, los participantes son notificados de que la transcripción está activada.

Los transcriptores

La transcripción autoalojada puede ejecutarse de dos formas, y LiveKit Cloud ofrece una tercera ruta gestionada. Las tres entregan su texto a través del mismo contrato de ingesta, por lo que el resto del producto se comporta de forma idéntica.

  • Modo A — Whisper: un agente solo-IA se suscribe al audio de la llamada, ejecuta OpenAI Whisper localmente, publica subtítulos en directo y envía segmentos al servidor. También puede muestrear una pantalla compartida a un modelo de visión, y los turnos hablados aparecen como tus mensajes en el chat de IA.
  • Modo B — OpenAI: una sesión de agente de LiveKit usa OpenAI para la conversión de voz a texto (y opcionalmente el LLM y la conversión de texto a voz), entregando segmentos a través del mismo contrato.
  • LiveKit Cloud: transcripción gestionada entregada al servidor a través de un webhook.

Subtítulos en directo durante una llamada

  1. Únete a una llamada

    Inicia o únete a una llamada en un espacio de trabajo, con la transcripción habilitada para tu organización.

  2. Activa los subtítulos

    Abre los controles de la llamada y activa los subtítulos en directo. La superposición aparece con etiquetas de hablante y marcas de tiempo.

  3. Elige entre texto simple o traducido

    Cambia la superposición entre transcripción y traducción para leer lo que se dice en otro idioma al instante.

  4. Decide si guardar

    Si la transcripción se guarda está determinado por tu preferencia Guardar transcripciones (activada por defecto) y la política de acceso del espacio de trabajo.

A
Alex M.
J
Jordan K.
S
Sam R.
D
Dana W.
Alex M.14:23🌐 Translate

— so the plan for Q4 is to double down on the onboarding flow and get the NPS above 70.

Superposición de subtítulos en directo durante una llamada — etiquetas de hablante y marcas de tiempo aparecen en tiempo real, con un botón de traducción.

Qué contiene un subtítulo

Dado que los subtítulos provienen del servidor, la precisión es constante entre los participantes independientemente de su dispositivo. Cada línea de subtítulo incluye:

  • Etiqueta de hablante — el nombre visible de quien está hablando.
  • Marca de tiempo — el tiempo dentro de la llamada, para referencia posterior.
  • Traducción — una representación traducida opcional, cuando la superposición está configurada para traducir.

Guardar transcripciones

Cada usuario tiene una preferencia Guardar transcripciones, encontrada en Ajustes, que está activada por defecto. Cuando el guardado está activo y la canalización está encendida, los segmentos de la llamada se persisten para que puedan buscarse y usarse como contexto de IA posteriormente.

Quién puede ver una transcripción guardada

Las transcripciones guardadas se rigen por una política de acceso de tres niveles por espacio de trabajo, por lo que una transcripción solo es visible para las personas que deberían verla:

PolíticaQuién puede leer la transcripción
Todo el espacio de trabajoTodos los miembros del espacio de trabajo.
Todos los participantes actualesTodos los que estuvieron en la llamada.
Solo los oyentes activosSolo los que estaban escuchando activamente en ese momento.
💡
Pregunta a tu IA sobre llamadas pasadas

Las transcripciones guardadas son consultables mediante RAG — el asistente puede buscarlas y citarlas en las respuestas, siempre filtradas por la política de acceso anterior para que las personas solo vean lo que tienen permitido. Prueba «¿Qué decidimos en el standup de ayer?» o «Resume la discusión sobre el presupuesto de la semana pasada.» Los embeddings son generados por un trabajo en segundo plano, con un umbral de confianza opcional.

Privacidad y consentimiento

La transcripción está desactivada hasta que un administrador la activa; los participantes son notificados cuando está activa; el acceso a las transcripciones guardadas está restringido por la política anterior, y los usuarios individuales controlan si sus transcripciones se guardan. Las ventanas de retención de datos para las transcripciones se establecen por espacio de trabajo en la pestaña de Privacidad.

ℹ️
Entre bastidores

Los subtítulos en directo y las transcripciones guardadas provienen completamente de la canalización de transcripción del lado del servidor — no hay un botón separado de «grabar» en la app, y Your Office AI no produce una grabación de vídeo de la llamada.