Integre a busca com IA em suas aplicações
O Elasticsearch Relevance Engine™ (ESRE) foi projetado para alimentar aplicações de busca baseadas em inteligência artificial. Use o ESRE para aplicar busca semântica com relevância superior pronta para uso (sem adaptação de domínio), integrar com grandes modelos de linguagem (LLMs) externos, implementar busca híbrida e usar modelos transformadores de terceiros ou os seus próprios.
Veja como é fácil começar a configurar o Elasticsearch Relevance Engine.
Assista ao vídeo de início rápidoCrie aplicações avançadas baseadas em RAG usando ESRE.
Inscreva-se no treinamentoUse dados privados internos como contexto com as funcionalidades de modelos de IA generativa para fornecer respostas confiáveis e atualizadas para as consultas dos usuários.
Assista ao vídeo“Estou entusiasmado com os benefícios que podemos trazer para os clientes com nossos investimentos para aproveitar o Elasticsearch no RelativityOne. Estamos experimentando o ESRE agora e estamos empolgados com seu potencial para fornecer resultados de busca poderosos e ampliados por IA aos nossos clientes.”
Chris Brown, Diretor de produto, Relativity
Amostras de código
Comece a criar a busca vetorial
Use uma única API para importar um modelo de embedding, gerar embeddings e escrever consultas de busca em escala usando a busca de vizinho mais próximo aproximado.
docker run -it --rm elastic/eland \
eland_import_hub_model \
--cloud-id $CLOUD_ID \
-u <username> -p <password> \
--hub-model-id sentence-transformers/msmarco-MiniLM-L-12-v3 \
--task-type text_embedding \
--start
Perguntas frequentes
Elasticsearch Relevance Engine é um conjunto de recursos que ajudam os desenvolvedores a criar aplicações de busca com IA e inclui:
- Recursos avançados de classificação de relevância líderes do setor, incluindo busca de palavras-chave tradicional com BM25, uma base de busca híbrida relevante para todos os domínios.
- Funcionalidades completas de banco de dados vetorial, incluindo a capacidade de criar embeddings, além de armazenamento e recuperação de vetores.
- Elastic Learned Sparse Encoder — nosso novo modelo de aprendizado de máquina para pesquisa semântica em uma variedade de domínios Classificação híbrida (RRF) para emparelhar recursos de pesquisa vetorial e textual para otimizar a relevância da pesquisa em uma variedade de domínios.
- Suporte para integrar modelos transformadores de terceiros, como o GPT-3 e 4 da OpenAI, por meio de APIs.
- Um conjunto completo de ferramentas de ingestão de dados, como conectores de banco de dados, integrações de dados de terceiros, rastreador da web e APIs para criar conectores customizados.
- Ferramentas para desenvolvedores para criar aplicações de busca em todos os tipos de dados: texto, imagens, séries temporais, geo, multimídia e muito mais.
O Elasticsearch é uma tecnologia de busca líder para sites (como descoberta e produtos de e-commerce) e informações internas (como bases de conhecimento de sucesso do cliente e busca empresarial). Com o ESRE, estamos fornecendo um kit de ferramentas para criar experiências de busca com IA. Capacite os usuários a expressar suas consultas em linguagem natural, na forma de uma pergunta ou descrição do tipo de informação que eles procuram. Combine essa funcionalidade de linguagem natural com IA generativa para aprimorar ainda mais as habilidades desses modelos com contexto de seus próprios dados, privados ou proprietários.
Sim,as funcionalidades incluídas no Elasticsearch Relevance Engine são projetadas e integradas na API _search do Elasticsearch. Os desenvolvedores podem usar a API da Elastic ou ferramentas que já conhecem, como o Kibana, para interagir com as funcionalidades que compõem o Elasticsearch Relevance Engine junto com o Elasticsearch para proporcionar uma experiência integrada.
O Elastic Learned Sparse Encoder é um modelo criado pela Elastic para pesquisa semântica de alta relevância em uma variedade de domínios. Atualmente, um modelo de aprendizado de máquina somente em inglês, ele captura as relações entre significados e palavras para recuperação de informações. Interessado em testes de benchmark com nosso novo modelo de recuperação? Leia este blog para saber mais.
Um transformador é uma arquitetura de rede neural profunda que serve como base para LLMs. Os transformadores consistem em vários componentes e podem ser compostos de codificadores, decodificadores e muitas camadas de rede neural “profunda” com muitos milhões (ou até bilhões) de parâmetros. Eles são normalmente treinados em grandes corpora de texto, como dados na internet, e podem ser ajustados para executar uma variedade de tarefas de PLN. Nosso novo modelo de recuperação usa uma arquitetura transformadora, mas consiste apenas em um codificador projetado especificamente para busca semântica em uma ampla variedade de domínios.
Todos os recursos do Elasticsearch Relevance Engine vêm com os planos Elastic Enterprise Search Platinum e Enterprise, como parte da versão 8.8. Você pode começar facilmente com incorporações e pesquisa vetorial e experimentar o modelo de modelo de recuperação. Confira uma demonstração dos recursos do Elastic Learned Sparse Encoder. Se você tiver uma licença do Elasticsearch, o Elasticsearch Relevance Engine está incluído como parte da sua compra.