Agentes
Un agente es la unidad central en VOCALS. Define cómo se comporta un asistente de voz con IA en una llamada -- qué dice, cómo suena y qué proveedores lo alimentan. Cada número de teléfono se asigna a un agente.
Crear un Agente
- Navega a Agentes en el panel de control.
- Haz clic en Crear Agente.
- Dale al agente un nombre descriptivo (ej., "Ventas Entrantes - Español" o "Soporte Nivel 1").
- Configura los ajustes descritos a continuación.
- Haz clic en Guardar.
Ajustes del Agente
Prompt del Sistema
El prompt del sistema define la personalidad, instrucciones y restricciones del agente. Este es el ajuste más importante -- determina todo sobre cómo se comporta el agente en la conversación.
You are a friendly customer support agent for Acme Corp. Your name is Sarah.
Your responsibilities:
- Answer questions about our products and pricing
- Help customers troubleshoot common issues
- Escalate complex technical problems to a human agent
Rules:
- Never discuss competitor products
- Always confirm the customer's name before making account changes
- Keep responses concise -- aim for 1-2 sentences per turn
Mejores prácticas para prompts del sistema:
- Sé específico sobre la longitud de las respuestas. Las conversaciones telefónicas necesitan respuestas cortas. Instruye al agente para que responda en 1-2 frases a menos que el llamante pida más detalle.
- Define una persona. Dale al agente un nombre, tono y personalidad. Los llamantes interactúan mejor con un personaje consistente.
- Establece límites. Indica explícitamente qué debe y qué no debe discutir el agente. Lista los temas que deben escalarse a un humano.
- Incluye frases de ejemplo. Si quieres que el agente use saludos, confirmaciones o despedidas específicas, inclúyelas en el prompt.
- Maneja casos extremos. Indica al agente qué hacer cuando no sabe la respuesta, cuando el llamante está molesto o cuando la conversación se desvía del tema.
- Mantenlo estructurado. Usa secciones con encabezados, viñetas y pasos numerados. Los LLMs siguen prompts estructurados de manera más fiable.
Evita prompts del sistema excesivamente largos. Cada token en el prompt del sistema añade latencia y coste a cada llamada al LLM. Apunta a 200-500 palabras. Si necesitas más, considera si parte de la información podría obtenerse dinámicamente mediante function calling.
Mensaje de Bienvenida
Lo primero que dice el agente cuando se conecta una llamada. Se reproduce como audio TTS antes de que el agente comience a escuchar.
Ejemplos:
"Hello, thank you for calling Acme Corp. How can I help you today?""Hi there! This is Sarah from Acme support. What can I do for you?"
Déjalo en blanco si quieres que el agente espere a que el llamante hable primero (útil para llamadas salientes donde el destinatario responde con "¿Hola?").
Idioma
El idioma principal de la conversación. Este ajuste se pasa al proveedor STT para mejorar la precisión de la transcripción. Configúralo para que coincida con el idioma que hablarán tus llamantes.
Valores comunes: en-US, en-GB, es-ES, es-MX, pt-BR, fr-FR, de-DE, zh-CN, ja-JP.
Sensibilidad de Interrupción
Controla con qué facilidad el llamante puede interrumpir al agente mientras está hablando. La interrupción (también llamada "barge-in") detiene la reproducción TTS actual y procesa lo que dijo el llamante.
| Nivel | Comportamiento |
|---|---|
| Muy Bajo | Requiere habla sostenida y clara para interrumpir. Mejor para entornos muy ruidosos (centros de llamadas, calles, fábricas). |
| Bajo | El llamante debe hablar fuerte o durante más tiempo para interrumpir. Reduce las falsas activaciones por ruido de fondo. |
| Medio | Ajuste equilibrado. Funciona bien para la mayoría de entornos. |
| Alto | El agente deja de hablar rápidamente cuando se detecta el habla del llamante. Mejor para entornos silenciosos. |
| Muy Alto | El agente deja de hablar ante la primera señal de habla del llamante. Mejor para entornos muy silenciosos y conversaciones de ritmo rápido. |
Si notas que el agente se interrumpe por ruido de fondo, baja la sensibilidad de interrupción. Si los llamantes se quejan de que el agente habla encima de ellos, súbela.
Interrumpible
Un interruptor booleano que habilita o deshabilita la interrupción por completo.
- Habilitado (predeterminado): El llamante puede interrumpir al agente a mitad de frase.
- Deshabilitado: El agente siempre termina su respuesta actual antes de escuchar. Úsalo para mensajes donde el mensaje completo debe ser escuchado (ej., avisos legales, declaraciones de cumplimiento normativo).
Duración Máxima de Llamada
La duración máxima de una llamada en segundos. Cuando se alcanza el límite, el agente dirá un mensaje de cierre configurable y colgará.
- Predeterminado:
600(10 minutos) - Establece un valor más bajo para casos de uso simples (confirmaciones de citas, encuestas) para controlar costes.
- Establece un valor más alto para llamadas de soporte complejas que puedan necesitar una conversación extendida.
Umbral de Silencio
Controla la sensibilidad de la Detección de Actividad de Voz (VAD) para la interrupción. Es un valor decimal (predeterminado 0.5) que determina con qué confianza el sistema debe detectar habla antes de activar una interrupción.
- Valores más altos (ej.,
0.7-0.9) requieren una detección de habla más segura, reduciendo falsas interrupciones por ruido de fondo. - Valores más bajos (ej.,
0.2-0.4) hacen la interrupción más sensible, captando habla más silenciosa pero también siendo más susceptible al ruido.
Esto funciona junto con el ajuste de sensibilidad de interrupción para afinar cómo responde el agente a las interrupciones del llamante.
Asignar Proveedores
Cada agente necesita un proveedor para cada etapa del pipeline:
- En la configuración del agente, busca la sección de Proveedores.
- Selecciona un Proveedor STT de tus proveedores configurados.
- Selecciona un Proveedor LLM.
- Selecciona un Proveedor TTS.
Puedes asignar diferentes proveedores a diferentes agentes. Por ejemplo, tu agente de ventas en inglés podría usar Deepgram + GPT-4o + ElevenLabs, mientras que tu agente de soporte en chino usa Qwen + Kimi + ElevenLabs.
Cambiar proveedores en un agente activo surte efecto en la siguiente llamada. Las llamadas activas continúan usando los proveedores que estaban configurados cuando la llamada comenzó.
Clonar un Agente
Para crear una variante de un agente existente:
- Abre el agente que quieres clonar.
- Haz clic en Clonar Agente.
- Modifica los ajustes según sea necesario (ej., cambiar el idioma, intercambiar la voz TTS, ajustar el prompt del sistema).
- Guarda con un nuevo nombre.
Esto es útil cuando necesitas agentes similares para diferentes idiomas o departamentos.
Probar un Agente
La prueba de agentes basada en web es una funcionalidad planificada. Una vez disponible, podrás probar agentes directamente desde el panel de control sin realizar una llamada telefónica real.
Mientras tanto, prueba tus agentes asignándolos a un número de teléfono y realizando una llamada. Revisa la transcripción y reproducción de audio de la llamada en Historial después de que termine la llamada.