¿Qué es la AI conversacional?
Definición de la AI conversacional
La AI conversacional permite a las personas simular conversaciones con máquinas. Mediante una combinación de procesamiento del lenguaje natural (NLP) y machine learning (ML), la AI conversacional usa los datos para recibir entradas de voz o texto y producir salidas de voz o texto con el objetivo, básicamente, de mantener una conversación con el usuario. Los chatbots, asistentes de AI virtuales y asistentes activados por voz son todos ejemplos de AI conversacional.
La AI conversacional puede parecer nueva, pero su primera iteración fue un chatbot desarrollado a mediados de la década del sesenta por Joseph Wizenbaum1. ELIZA fue el primer robot psicoterapeuta del mundo, y usaba NLP para buscar coincidencias en los patrones de las entradas y generar respuestas. En un nivel básico, la AI conversacional aún funciona así en la actualidad, con el reconocimiento de patrones y analíticas predictivas. La principal diferencia: ELIZA se limitaba a los scripts programados en el producto. En la actualidad el desarrollo de modelos de lenguaje grandes (LLM), los avances en el poder informático, la disponibilidad de datos y el ML permiten a la AI conversacional "aprender" a usar una gran cantidad de datos para responder a las búsquedas. Como resultado, la AI conversacional contemporánea tiene una variedad de usos que van desde asistentes virtuales hasta chatbots de servicio al cliente y sistemas de soporte automatizados.
La AI conversacional está ayudando a democratizar el acceso a la información, los bienes y los servicios, al mismo tiempo que mejora las experiencias de los clientes. Hacer que este intercambio sea accesible para todos (de modo que los usuarios no necesiten ser codificadores para recibir respuestas a las búsquedas) requiere la capacidad de tener una conversación de lenguaje natural. En el extremo comercial, la AI conversacional puede alivianar la carga a los empleados y aplanar las curvas de aprendizaje, lo que en última instancia mejorará la eficiencia operativa.
Componentes clave de la AI conversacional
La AI conversacional consiste en procesamiento del lenguaje natural (NLP), algoritmos de machine learning (ML), reconocimiento de voz y sistemas de gestión del diálogo.
Procesamiento del lenguaje natural
El procesamiento del lenguaje natural ayuda a los equipos a procesar y comunicar lenguaje humano mediante la tokenización, el etiquetado de partes de la oración, el reconocimiento de entidades con nombre y el análisis de sentimiento. La lingüística computacional sustenta estas técnicas mediante analíticas de datos para desglosar y analizar el lenguaje y el discurso. Un análisis léxico asigna valores de datos a los caracteres de una búsqueda. El análisis gramatical identifica el orden de las palabras en una búsqueda y las etiqueta. El análisis sintáctico luego identifica el significado de una palabra a través de su valor sintáctico.
Por ejemplo, en la oración "Me asombra lo liviana que se siente esta computadora portátil", el análisis sintáctico identificaría la palabra "liviana" como un adjetivo que describe "esta computadora portátil". El análisis semántico usa la salida sintáctica para determinar el significado de una palabra en contexto a fin de comprender el sentimiento o la intención de una búsqueda.
Para continuar con el ejemplo anterior, si bien "liviana" podría referirse al peso o a la falta de contenido, el contexto sintáctico (junto con "asombra" y "siente") sugiere un sentimiento positivo. El análisis semántico interpreta "liviana" como una valoración de la portabilidad de la computadora, en lugar de una connotación negativa.
Así es como la AI conversacional suena conversacional.
Machine learning
El machine learning usa datos y algoritmos a fin de imitar la capacidad humana para aprender. Los algoritmos de machine learning realizan una predicción que se basa en los datos con los que se entrenaron, evalúan la calidad de la predicción frente a algunos parámetros predefinidos y actualizan u optimizan el proceso de decisiones a fin de mejorar las predicciones futuras.
Un modelo de machine learning se puede entrenar de tres maneras diferentes: supervisado, semisupervisado y no supervisado. El aprendizaje supervisado usa sets de datos etiquetados con el objetivo de entrenar un algoritmo para que tome decisiones. Los modelos de machine learning no supervisados se entrenan con datos que no están etiquetados, lo que permite a los algoritmos identificar patrones y grupos de datos sin intervención humana. El aprendizaje semisupervisado es una combinación de modelos supervisados y no supervisados, en el que se aplica el aprendizaje de sets de datos etiquetados más pequeños en sets de datos no etiquetados más grandes.
El machine learning funciona de la mano del NLP para los motores de recomendaciones de aplicaciones, los asistentes virtuales y las tecnologías de reconocimiento de voz.
Reconocimiento de voz
El reconocimiento de voz, también conocido como sistema de voz a texto, es la capacidad de una máquina para convertir el lenguaje oral en texto escrito. El reconocimiento de voz del NLP y los algoritmos de ML para comprender la gramática, la sintaxis, la estructura y la composición de una señal de audio mientras que las técnicas de ponderación lingüística, etiquetado del orador, entrenamiento acústico y filtrado de groserías entrenan el modelo.
La ponderación lingüística mejora la precisión de reconocimiento mediante la clasificación de palabras recurrentes. El reconocimiento de voz también puede etiquetar a diferentes participantes a medida que transcribe la voz; esto es el etiquetado de oradores. El entrenamiento acústico permite al software de reconocimiento adaptarse a diferentes calidades de audio, desde distintos niveles acústicos ambientales hasta diversos atributos vocales. El filtrado de groserías se puede usar para suavizar transcripciones a través de la identificación de lenguaje profano. Se suele usar en servicios de transcripción o aplicaciones de dictado.
Sistemas de gestión del diálogo
Los sistemas de gestión del diálogo interpretan y contextualizan conversaciones entre máquinas y usuarios. Tanto en contextos orales como escritos, los sistemas de gestión del diálogo representan el conjunto de procesos que realizará una máquina para "comprender" a un usuario humano y "comunicarse" con este. Por ejemplo, un usuario hace una búsqueda en un chatbot de reserva de viajes para reservar un vuelo. El bot responde con un conjunto de preguntas de seguimiento:
Usuario: Quiero reservar un vuelo.
Bot: ¡Hola! Por supuesto, puedo ayudarte con eso. ¿Cuál es la ciudad de salida?
Usuario: Montreal.
Bot: Salida desde el aeropuerto YUL. ¿Cuál es el destino?
Usuario: París.
Bot: ¡Excelente! Salida desde YUL y llegada a CDG.
Esta conversación está impulsada por un sistema de gestión del diálogo que usa mecanismos de comentarios y aprendizaje de políticas con el objetivo de brindar respuestas contextuales y precisas. Identifica la solicitud, sigue los pasos siguientes necesarios y continúa el diálogo de manera natural y conversacional. Una gestión del diálogo efectiva garantiza que la AI pueda ocuparse de conversaciones con varios turnos y del cambio de contextos.
¿Por qué es importante la AI conversacional?
La AI conversacional ha cambiado la forma en que los usuarios interactúan de forma significativa con la tecnología cotidiana, y su importancia se ve reflejada en los beneficios:
- Mejor eficiencia operativa: la AI conversacional, desde asistentes virtuales hasta aplicaciones de búsqueda semántica, ayuda a los empleados a encontrar respuestas con rapidez y automatizar tareas para que puedan enfocarse en tareas más complejas y creativas. Al dedicar menos tiempo a pequeños trabajos que requieren mucho tiempo, la productividad y la eficiencia operativa se disparan.
- Soporte al cliente mejorado: la AI conversacional proporciona respuestas instantáneas personalizadas y mejora la satisfacción del cliente y su compromiso gracias a que ofrece disponibilidad permanente, lo que reduce los tiempos de espera, y se ocupa de una gran variedad de consultas de manera eficiente. Puede abordar problemas comunes de forma rápida y precisa, lo que libera a los agentes humanos para que se enfoquen en tareas más complejas, y esto, a su vez, lleva a un sistema de soporte al cliente más efectivo y con mejor capacidad de respuesta que crea relaciones más sólidas con los clientes y promueve la lealtad a largo plazo.
- Mayor escalabilidad: la AI conversacional impacta de manera positiva en la capacidad de una organización para ocuparse de un gran volumen de interacción con el cliente, dado que puede responder a varios usuarios en simultáneo. La escalabilidad de las interacciones también mejora la eficiencia operativa a través de procesos optimizados, tiempos de respuesta más breves y menores costos operativos. Esto permite a la organización brindar servicio a más clientes con menos recursos y mejorar la satisfacción de los clientes gracias a que ellos mismos pueden resolver los problemas sin necesidad de esperar a un representante.
Por último, la AI conversacional es importante debido a que es rentable. Las pequeñas y medianas empresas se benefician de la capacidad de la AI conversacional para ocuparse de un gran volumen de interacciones en simultáneo, de forma permanente, lo que reduce grandes costos comerciales relacionados con la capacitación y los salarios.
¿La AI conversacional es lo mismo que la AI generativa?
La AI conversacional es una aplicación específica de la AI generativa. Sin embargo, pueden tener diferentes objetivos, generar salidas distintas y depender de entrenamientos diversos. La diferencia es que la AI conversacional continúa, y mantiene, una interacción bidireccional a través de la predicción, mientras que la AI generativa produce contenido que se basa en solicitudes.
Al conversar con un usuario, la AI conversacional responde a través del análisis de la búsqueda, el pareseo de una base de conocimientos (una base de conocimientos local específica de una empresa, recuperada a través de la generación aumentada de recuperación [RAG] o de toda internet, en el caso de ChatGPT) y el reconocimiento de patrones.
La salida que genera la AI conversacional es una predicción, que es el mismo principio que permite a la AI generativa "crear" contenido nuevo. Esto permite tanto a la AI conversacional como generativa producir respuestas que sean relevantes en cuanto al contexto.
Casos de uso y ejemplos de AI conversacional
De "Oye, Siri" a asistentes virtuales y chatbots en apps de banca, la AI conversacional se está usando en todas las industrias. Algunos casos de uso comunes incluyen los siguientes:
Servicio y soporte al cliente
La AI conversacional se suele usar en aplicaciones de servicio y soporte al cliente, principalmente como chatbots, para responder a búsquedas comunes y realizar algunas tareas. Los chatbots pueden responder preguntas frecuentes relacionadas con envío, facturación, políticas de devolución y más. También pueden brindar soporte en línea como asistente de compras, ofrecer recomendaciones personalizadas según el historial de búsqueda o compras anteriores.
Atención médica
La AI conversacional, cuando se usa en atención médica, puede mejorar el compromiso de los pacientes y eliminar la carga administrativa a los proveedores. La tecnología de reconocimiento de voz se usa en los consultorios de algunos médicos para transcribir las interacciones entre pacientes y médicos, con el objetivo de mantener notas actualizadas y detalladas relacionadas con el paciente y su atención. Los asistentes virtuales también pueden programar citas, brindar información médica y proporcionar recordatorios para el cumplimiento con la medicación.
Seguridad y observabilidad
Los asistentes virtuales son un componente cada vez más deseado de cualquier pila de tecnología de seguridad u observabilidad. Al aprovechar la tecnología de búsqueda, enlazando a bancos de conocimientos locales y usando analíticas de datos, los asistentes virtuales ayudan a los usuarios de IT a responder a una variedad de preguntas específicas del contexto, acceder a datos y conocimientos especializados, y automatizar ciertas tareas.
Comercio electrónico
La AI conversacional se usa ampliamente en el comercio electrónico a fin de brindar asistencia al cliente para los compradores en línea. Ya sea en forma de un chatbot o un asistente virtual, la AI conversacional suplementa a los representantes de servicio al cliente humanos contestando a preguntas frecuentes y ofreciendo recomendaciones personalizadas. La disponibilidad permanente de la AI conversacional también significa que puede impactar de manera positiva la experiencia del cliente y, como resultado, impulsar las ventas.
Educación y capacitación
En un contexto de educación, la AI conversacional se usa para brindar tutoría personalizada, responder preguntas de los estudiantes y facilitar las experiencias de aprendizaje interactivas. Ofrece recursos adicionales a los estudiantes y, al hacer esto, brinda soporte para los educadores.
¿Cuál es la diferencia entre los chatbots y la AI conversacional?
Mientras que los chatbots son una forma de AI conversacional, son solamente una aplicación de esta. AI conversacional es un término abarcativo que incluye una variedad de aplicaciones de ML y NLP, como asistentes de voz y tecnologías de texto a voz (TTS) y voz a texto (STT).
Los chatbots se entrenan con algoritmos basados en reglas para ocuparse de tareas específicas y brindar respuestas predefinidas. Debido a esto, se utilizan para interacciones directas y, a veces, pueden tener problemas con conversaciones complejas o llenas de matices.
Los asistentes de voz son chatbots más avanzados y usan tecnología de reconocimiento de voz para interactuar con el usuario. El beneficio de los asistentes de voz es que son manos libres y pueden realizar diversos comandos en distintos contextos: mientras los usuarios están cocinando, limpiando, conduciendo, etc.
Detrás de la capacidad del asistente de voz de comprender y responder a las interacciones de los usuarios se encuentran las tecnologías de TTS y STT. Cuando un asistente de voz escucha una solicitud ("Oye, Siri") depende de STT para identificarla y comprenderla. Para responder, "¿Sí?", debe usar TTS y convertir la respuesta de texto "aprendida" a una respuesta de voz.
Otras tecnologías también se integran con la AI conversacional, como el análisis de sentimiento. Un chatbot puede necesitar reconocer el lenguaje negativo para responder de manera empática y brindar un servicio al cliente efectivo.
Desarrollo e implementación de la AI conversacional
El desarrollo y la implementación de la AI conversacional comienza con la identificación del contexto en el que se requiere y los objetivos que debe cumplir. A partir de estas decisiones, puedes diseñar flujos conversacionales efectivos, elegir la plataforma indicada y establecer las métricas que miden el éxito.
Las soluciones basadas en el cloud ofrecen escalabilidad y flexibilidad comercial, sin necesidad de una gran infraestructura en las instalaciones. Hospedar aplicaciones de AI conversacional en plataformas en el cloud permite a las empresas aprovechar herramientas de AI poderosas que escalan conforme sea necesario, y se pueden desplegar de manera mucho más sencilla.
Diseñar flujos conversacionales
Para diseñar flujos conversacionales, mapea los recorridos de los usuarios y respáldate en las preguntas más frecuentes (FAQ). Las FAQ son esenciales para el desarrollo de una herramienta de AI conversacional, y el recorrido del usuario puede ayudar a informar qué solicitudes de diálogo priorizar en el desarrollo. Comenzar de a poco es fundamental. Esto te permite probar un caso de uso y ajustar el tono (amistoso, neutro, etc.) de la salida para que se ajuste a tu marca y necesidades.
Seleccionar la plataforma correcta
Seleccionar la plataforma de AI conversacional correcta comienza por tener objetivos claros. ¿Es un chatbot de servicio al cliente, necesitas capacidades multilingües o buscas características de automatización? A partir de esto, puedes identificar las capacidades de varias plataformas y probar modelos preentrenados para ver si son los adecuados.
Ten en cuenta si la plataforma puede integrarse sin inconvenientes en tus sistemas actuales y evalúa las capacidades con humanos involucrados: ¿cuánto trabajo manual se requiere o es posible para realizar ajustes? Elegir la plataforma correcta también dependerá de tus necesidades de personalización.
Establecer métricas de éxito
Una vez implementada, deberás establecer métricas de éxito basadas en tus objetivos. Estas métricas de éxito deben medir la satisfacción de los usuarios, la precisión de las respuestas, la velocidad de respuesta y las tasas de finalización de las interacciones.
Asegurar la seguridad y la privacidad de los datos
Asegurar la seguridad y la privacidad de los datos es esencial para desarrollar una AI conversacional efectiva. Al elegir una plataforma que integre medidas de seguridad y privacidad de los datos, y establecer pautas de seguridad y privacidad de los datos en el proceso de implementación, las empresas pueden cumplir con los estándares normativos y de cumplimiento. Esto es fundamental para mantener la confianza y evitar problemas legales.
Desafíos de la AI conversacional
Los desarrollos de NLP y ML han producido aplicaciones de AI conversacional mucho más sofisticadas; sin embargo, la tecnología sigue teniendo problemas con varios desafíos:
- Comprender una entrada poco clara o ambigua del usuario es un importante desafío para la AI conversacional. El tono, el sarcasmo y los errores ortográficos, sintácticos y de otro tipo pueden confundir a la AI y generar respuestas incorrectas, imprecisas o poco satisfactorias.
- La capacidad de comprender acentos y distintos idiomas puede ser un desafío para el software de reconocimiento de voz. La tecnología debe estar entrenada con una gran variedad de datos, lo cual requiere de muchos recursos.
- Garantizar la confiabilidad y la precisión es otro desafío para la AI conversacional. Las organizaciones deben desplegar recursos para revisar y evaluar la calidad de salida de sus herramientas de AI conversacional a fin de evitar alucinaciones. Esto puede requerir mucho tiempo y recursos.
Además, las preocupaciones éticas en el uso de la AI conversacional son un desafío importante. Asegurar respuestas sin sesgos y mantener la privacidad de los usuarios son cuestiones esenciales en el desarrollo de la AI conversacional. Los desarrolladores deben abordar estos problemas a fin de crear sistemas justos y confiables.
Tendencias futuras en la AI conversacional
A medida que el NLP, ML y las tecnologías de búsqueda avancen en su desarrollo, la AI conversacional se volverá cada vez más sofisticada: pasará de una comprensión mejorada de las entradas a una mejor detección de las emociones y el sentimiento. Las capacidades de personalización de la AI conversacional mejorarán, lo que a su vez mejorará las experiencias de los usuarios.
Es probable que veamos una integración continua de las herramientas de AI conversacional en la IoT y los dispositivos inteligentes para continuar mejorando las interacciones de los clientes con las máquinas.
AI conversacional con Elastic
Elastic aprovecha la AI generativa para impulsar su AI Assistant de lenguaje natural a fin de guiar a los SRE y analistas de seguridad desde la detección hasta la resolución. Con el uso de la AI conversacional, AI Assistant actúa como copiloto en la automatización y optimización de procesos: libera a los ingenieros y analistas de realizar tareas rutinarias para que puedan enfocarse en problemas más complejos.
Recursos de AI
- IBM partners with Elasticsearch to deliver conversational search with watsonx Assistant (IBM se asocia con Elasticsearch para brindar búsqueda conversacional con watsonx Assistant)
- NLP vs. LLM: Conoce las diferencias
- Cómo hacer un chatbot: Qué debe hacer un desarrollador con la AI
- Herramientas y capacidades de AI generativa de Elastic
- Optimizing chatbots with NLP & vector search in Elasticsearch (Optimizar chatbots con NLP y búsqueda de vectores en Elasticsearch)