Saltar al contenido principal

Bienvenido a VOCALS

VOCALS (Voice-Orchestrated Call and Language System) es una plataforma de telefonia impulsada por IA que gestiona conversaciones de voz en tiempo real. Se integra con proveedores SIP para telefonia y soporta proveedores de IA intercambiables para reconocimiento de voz (STT), modelos de lenguaje (LLM) y sintesis de voz (TTS).

Que puedes hacer con VOCALS?

  • Crear agentes telefonicos con IA — Crea agentes conversacionales de IA que contestan y realizan llamadas telefonicas
  • Elegir tu stack de IA — Intercambia proveedores de STT, LLM y TTS por agente (Deepgram, OpenAI, ElevenLabs, Anthropic y mas)
  • Escalar operaciones de llamadas — Encola llamadas salientes con limitacion de velocidad, gestiona llamadas entrantes concurrentes
  • Monitorear todo — Panel de analiticas en tiempo real con metricas de latencia, coste y conversacion
  • Integrar via API — API REST completa y sistema de webhooks para crear flujos de trabajo personalizados

Como funciona

Llamante ──► Proveedor SIP ──► Orquestador VOCALS ──► STT (voz → texto)
│ │
│ texto transcrito
│ │
│ LLM (generar respuesta)
│ │
│ texto de respuesta
│ │
│ TTS (texto → voz)
│ │
◄──────────────── audio de vuelta al llamante

Cada llamada fluye a traves de un pipeline en tiempo real: el audio entrante se transcribe, la transcripcion se envia a un LLM para generar una respuesta, y la respuesta se sintetiza de vuelta en voz — todo en menos de 2 segundos.

Siguientes pasos