IT 领导者需要矢量搜索来提高搜索体验的 5 大原因

illustration-industries-retail-social-1680x980.png

与出色搜索引擎(例如 Google 和 Amazon)之间的频繁交互提升了客户对快速且相关的搜索体验的期望。矢量搜索(又称为语义矢量搜索)会利用深度学习和 Machine Learning 来采集数据的意思和上下文。它能提升贵公司的搜索体验,并带来一系列益处,包括: 

  • 节省精力,向您的用户提供高相关度的结果 
  • 快速返回搜索结果,即使针对种类丰富的大量数据,亦是如此
  • 针对文本、图像和音频实现新的搜索类别
  • 直接向客户提供更准确的产品推荐信息、FAQ 答案甚至个性化内容

对于技术部门领导者,不妨详细了解一下矢量搜索,以及它如何帮助您不仅达到而且超出客户期望。它可以帮助您实现搜索体验转型,并帮助您实现业务目标。

所以,什么是矢量搜索?

矢量搜索会将文本、音频和图像转换为数字表示式,并且会利用深度学习和 Machine Learning (ML) 来解读这些表示式的意思、意图和上下文,从而提供相关度高得多的搜索结果。

Video thumbnail

语义矢量搜索可实现新的搜索类别

无论如何编写搜索查询,我们都期望获得高相关度的搜索结果。但即使是抽象的关键字搜索,也仍需要高度的自然语言理解能力,以及飞快的响应时间。除此之外,人们还渴望获得更广范围的搜索体验——从针对视觉购物的图片搜索,到音频搜索(例如 Amazon Alexa),再到应用内视觉素材推荐(例如 Pinterest)——有一点变得很明确:搜索需要根据我们查找内容的方式进行调整。

语义矢量搜索技术能够更好地理解人类语言,而且可以解读不同的数据格式,例如视觉素材、音频和非结构化文本。它可以作为非结构化数据与用户意图解读(不仅是他们的关键字)之间的桥梁,打造强大的体验,从而不仅达到,而且还可能超出客户期望。

矢量搜索能够大幅推动实现营收增长 

矢量搜索已得到广泛应用,可用以提高相关度、提升销售额并推动营收增长。

Spotify 如何利用矢量搜索

Spotify 并非一直针对播客节目使用矢量搜索。就在最近,Spotify 还主要依赖关键字词条匹配。这一搜索方法将会返回其索引元数据中包含查询关键字的所有条目。但用户有时输入的并非他们想查询的准确内容。他们经常不知道应该使用哪个搜索词,或者以特别异乎寻常的方法来表达自身想法。

通过矢量搜索,Spotify 得以匹语义上相关的结果,而不再需要准确的字词匹配,从而在节省大量精力的同时提供更相关的内容。例如,搜索“电动汽车气候影响”现在会返回“电动汽车和生态”或“电动车辆环境影响”的结果。 语义矢量搜索可以识别词汇“气候”和“生态”或“电动汽车”和“电动车辆”之间的相似度,无需搜索工程师或用户进行任何操作。  

家得宝如何借助语义矢量搜索提供更相关的搜索结果

家得宝 (Home Depot) 的库存列表上有 200 多万种产品,包括高度专业化的工具。客户之前难以找到可满足其需求的正确工具,因此经常需要尝试多次并备感沮丧,这还导致家得宝的退货量增加。 通过实施语义矢量搜索,家得宝得以将矢量搜索和文本搜索结合到一起,向客户提供更相关的结果。

例如,当客户搜索关键字“屋顶维修用品”时,还会返回“盖板”。这减轻了家得宝搜索团队的工作量,因为他们不再需要将创意产品描述、地区差异以及易错词上传到他们的搜索索引中。 

详细了解自然语言处理 (NLP)——矢量搜索所依托的技术 >> 

无论公司规模如何,都可以实施矢量搜索

矢量搜索可用于广泛的用例。无论贵公司规模如何,也无论您有多少数据,只要您使用正确的工具,矢量搜索都能帮助您提升搜索体验。矢量搜索能够帮助您实现下列目标:

提高相关度,进而推动实现更好的互动

向用户提供更多有用的结果,进而提高用户与您的网站和应用的互动程度。当字词有多重意思或者意思模糊时,基于关键字的搜索可能会效果较差。即使对于特别大的数据集,语义矢量搜索也能提供更精准的结果。即使用户不知道准确的关键字,此方法仍能够利用语义搜索技术返回相关的结果。 

即使数据量大,也能实现更快的性能

矢量搜索可与传统的搜索评分相结合以提供更佳的搜索体验。即使对于更大型的数据集,这种方法也能更快地提供更相关的结果。诸如最近邻和近似最近邻等算法会利用高效方法来针对搜索查询对大量文档进行处理和排序。 

扩大了搜索类别

通过矢量搜索引擎(被称为矢量数据库、语义或余弦搜索)实现新类型的搜索,例如图像和音频。例如,电商企业可以允许网站访客上传诸如连衣裙等的产品图片,并搜索相似产品。 这能加强互动,还能让部分购物者更轻松地进行搜索。

语义矢量搜索会解读搜索词的上下文、意图和意思,这样您的客户就省事了

通过确定查询的意图、意思和上下文,语义矢量搜索能够实现更高的相关度。实现过程如下:首先将搜索查询转换为有意义的数字表示式或矢量,然后将此表示式与数据集进行对比以衡量相似度并找到最相关的结果。为了做出明智决定,技术部门领导者需要对矢量搜索的技术层面拥有整体了解,有三大组成部分需要知道。

矢量搜索引擎运行方式的技术流程

1. 通过矢量嵌入将文本转换为数字:任何算法都需要数字才能运行。矢量会将关键字文本转换为数字数据,且此数字数据要能够保留文本的语言学内容。举例,两个广泛使用的模型——Word2VecBERT——的创建过程就是:分析大样本量的语言数据,以理解词汇同时出现的频率以及词汇之间的关系。因此,“加拿大”的矢量可能在一个方向上与“法国”相近,而在另一个方向上与“多伦多”相近。这些模型使我们能够将关键字、句子或段落转换为可进行对比的矢量嵌入。

2. 通过更优的搜索算法提高搜索速度:矢量搜索的另一个必备组成部分是性能优异的算法,以便快速对比并返回相关的结果,即使需要对数十亿份文档进行对比也不在话下。这其中就包括近似最近邻(ANN,临近算法的一种形式),此算法可用来在给定集合中找出与给定查询最接近(最相似)的结果。ANN 可高效运行,能在确保性能的前提下扩展到大型数据集。为了提高查询速度,会生成一幅图表以在所有数据点之间进行导航并将矢量快速映射到最相似的匹配结果。  

3. 使用距离指标找出相似结果:矢量使得我们能够基本上向每个关键字分配一组不同的坐标,这组坐标可通过衡量搜索词汇同时出现时的距离远近来评估查询内容和文档之间的相似度。矢量之间的距离越近,内容相似度越高。会使用诸如余弦相似度等衡量指标来确定两个数字和矢量序列之间的相似度,并返回最相似的结果。

如何快速获得矢量搜索引擎的所有益处

尽管有些解决方案承诺提供更佳的搜索体验,但 Elastic 是搜索驱动型技术方面的公认领导者。我们的客户能够快速体验到使用 Elastic 平台的益处,并使用诸如矢量搜索等创新性的新功能来持续优化他们的搜索体验。 

为什么要使用 Elastic 来进行矢量搜索?

Elastic 会提供一个简单的部署路径,让您实施矢量搜索和混合搜索,这样您便可以立即开始改善搜索体验。之所以这样说,是因为我们的矢量搜索会结合可实现搜索相关度的多种方法,让您不仅感受到矢量搜索的强大能力,还能体验到 Elastic 的所有优势——性能强大、简单易用且可自定义。 

您可以部署矢量搜索来弥补您搜索体验中最巨大的差距。

如有大量文件的话,Elastic 在查询性能上速度更快。.为了提高查询速度,Elastic 会使用生成的一幅图表以在所有数据点之间进行导航并将矢量快速映射到最相似的匹配结果。这种实现矢量相似度搜索的方法使用了一种名为“分层可导航小世界”(HNSW) 的 ANN 算法。如要加快查询性能,我们支持使用多层 HNSW,从而允许您更快速地遍历图表。新图层会优化查询路径,因为每个新增的更高图层拥有更少的数据点,从而在更远的距离内只需在数据点之间进行更少的跳转即可找到最近邻。 

Elastic 提供简单的集成式端到端解决方案如我们之前讨论的,语义矢量搜索需要矢量嵌入输入才能确定相似度。大部分解决方案都需要通过外部流程来生成矢量嵌入,例如,对于文本可能需要深度神经网络,但 Elastic 不是这样。Elastic 的矢量搜索的优势是您可以无比轻松地为矢量嵌入创建支持。

这是通过密集矢量字段类型来实现的,该字段类型会将密集矢量作为浮点值进行存储,结合 Elastics kNN search API 可用来快速找到相似结果。这简化了实施过程,让您能够更轻松地生成矢量。团队可以立即体验到价值。而且,您可以利用 Elastic 来对矢量进行分发、计算和扩展,从而提升性能并降低成本。 

Elastic 可以按照您的方式运行——根据您的需求进行自定义Elastic 支持 PyTorch,让您可以完全控制如何部署自己的模型。您可以根据具体需求或所在行业进行自定义,从而获得竞争优势。Elastic 还通过 HuggingFace 提供开箱即用型模型,为您提供一个可以快速启动的选项;此模型依靠的是一个不断壮大的领先语言模型社区。 

更优的搜索体验有利于您的业务

越来越旺盛的客户需求使得良好的搜索体验成为不可或缺的一环。幸运的是,语义矢量搜索是一项不断发展的技术,能够助您实现打造杰出搜索体验的承诺。无论是提供新类型的搜索,更快地获得结果,实现更高的相关度,还是打造个性化体验,Elastic 都能助您实现。如要继续您的旅程,请参阅我们的技术博客了解如何通过矢量搜索真正地实现改善。