Generación aumentada de recuperación, un problema de búsqueda
La búsqueda es la infraestructura crítica para trabajar con modelos de lenguaje grandes (LLM) a fin de crear las mejores experiencias de AI generativa. Tienes una oportunidad de solicitar a un LLM que brinde la respuesta correcta con tus datos, por lo que la relevancia es esencial. Basa tus LLM en la generación aumentada de recuperación (RAG) con Elastic.
Conoce cómo las innovaciones más recientes de Elastic escalan los casos de uso de AI generativa.
Lee el blogIncorpora la RAG en tus apps y prueba distintos LLM con una base de datos de vectores.
Descubre más en los laboratorios de ElasticsearchConoce cómo crear aplicaciones basadas en RAG avanzadas con Elasticsearch Relevance Engine™.
Mira el video de inicio rápidoCUENTA CON LA CONFIANZA DE LAS EMPRESAS FORTUNE 500 PARA IMPULSAR LA INNOVACIÓN DE AI GENERATIVA
Prepara tus datos para la RAG
La RAG amplía el poder de los LLM mediante el acceso a datos privados relevantes sin necesidad de volver a entrenar. Cuando usas la RAG con Elastic, obtienes beneficios de lo siguiente:
- Técnicas de búsqueda de vanguardia
- Selección sencilla de modelos y capacidad de intercambiar modelos sin esfuerzo
- Acceso seguro a documentos y basado en roles para garantizar que tus datos permanezcan protegidos
Transforma las experiencias de búsqueda
¿Qué es la generación aumentada de recuperación?
La generación aumentada de recuperación (RAG) es un patrón que mejora la generación de texto mediante la integración de información de fuentes de datos privadas. Dado que proporciona contexto específico del dominio al modelo generativo, la RAG mejora la precisión y la relevancia de las respuesta de texto generadas.
Utiliza Elasticsearch para ventanas de contexto de alta relevancia que se basan en tus datos privados para mejorar la salida del LLM y brindar la información en una experiencia conversacional segura y eficiente.
CÓMO FUNCIONA LA RAG CON ELASTIC
Mejora tus flujos de trabajo de RAG con Elasticsearch
Descubre cómo usar Elastic para flujos de trabajo de RAG mejora las experiencias de AI generativa. Sincroniza fácilmente con la información en tiempo real mediante fuentes de datos privados para obtener las mejores respuestas de AI generativa más relevantes.
El pipeline de inferencias de machine learning usa procesadores de ingesta de Elasticsearch para extraer las incrustaciones de manera eficiente. Mediante la búsqueda perfectamente combinada de texto (coincidencia BM25) y vectores (kNN), recupera los documentos con mejor relevancia para la generación de respuestas sensibles al contexto.
CASO DE USO
Servicio de preguntas y respuestas que se ejecuta en tu set de datos privados
Implementa experiencias de preguntas y respuestas usando la RAG, impulsada por Elasticsearch como base de datos de vectores.
AI Search, en acción
Cliente destacado
Consensus actualiza la plataforma de investigación académica con búsqueda semántica avanzada y herramientas de AI de Elastic.
Cliente destacado
Cisco crea experiencias de búsqueda impulsadas por AI con Elastic en Google Cloud.
Cliente destacado
Georgia State University aumenta la información a partir de los datos y explora cómo ayudar a los estudiantes a solicitar asistencia financiera mediante la búsqueda impulsada por AI.
Preguntas frecuentes
La generación aumentada de recuperación (comúnmente conocida como RAG) es un patrón de procesamiento de lenguaje natural que permite a las empresas buscar en fuentes de datos privados y brindar contexto que sirva como base para modelos de lenguaje grandes. Esto permite respuestas en tiempo real más precisas en las aplicaciones de AI generativa.
Cuando se implementa de manera óptima, RAG brinda acceso seguro en tiempo real a datos privados relevantes y específicos del dominio. Puede reducir la incidencia de alucinaciones en las aplicaciones de AI generativa y aumentar la precisión de las respuestas.
RAG es una técnica compleja que depende de lo siguiente:
- La calidad de los datos que se le proporcionan
- La efectividad de la recuperación de búsqueda
- La seguridad de los datos
- La capacidad de citar las fuentes de las respuestas de AI generativa con el objetivo de ajustar los resultados
Además, elegir la AI generativa o el modelo de lenguaje grande (LLM) indicados en un ecosistema que avanza con rapidez puede presentar desafíos para las organizaciones. Y los costos, el rendimiento y la escalabilidad asociados con RAG pueden afectar la velocidad con la que las empresas lanzan las aplicaciones a producción.
Elasticsearch es una plataforma de AI flexible y base de datos de vectores que puede indexar y almacenar datos estructurados y no estructurados a partir de cualquier fuente. Proporciona una recuperación de la información eficiente y personalizable, además de vectorización de miles de millones de documentos. También ofrece seguridad empresarial mediante el control de acceso por roles y a nivel de los documentos. Elastic proporciona una interfaz estándar para acceder a las innovaciones de un ecosistema de GenAI que sigue creciendo, lo que incluye hiperescaladores, repositorios de modelos y marcos de trabajo. Por último, Elastic está probado en entornos de escala de producción y brinda servicio a más del 50 % de las empresas de Fortune 500. Explora cómo crear sistemas de RAG en Elastic con Playground.
Elastic ofrece búsqueda entre clusters (CCS) y replicación entre clusters (CCR) para ayudarte a gestionar y asegurar los datos en entornos privados, en las instalaciones y en el cloud. Con CCS y CCR, puedes hacer lo siguiente:
- Asegurar alta disponibilidad
- Mantener el cumplimiento de las normativas de protección de datos globales
- Lograr la soberanía y privacidad de los datos
- Crear una estrategia efectiva de recuperación ante desastres
Elastic también ofrece un control de acceso basado en roles y a nivel de los documentos que autoriza a clientes y empleados a recibir solo respuestas con los datos a los que tienen acceso. Y nuestros usuarios pueden obtener información gracias a una observabilidad y monitoreo integrales de cualquier despliegue.