Elastic 8.0 版:在速度、扩展、高相关性和简单性方面开启了一个全新的时代

blog-thumbnail-generic-release.png

我们非常高兴地宣布 Elastic 8.0 版正式发布。Elastic 8.0 版通过改进 Elasticsearch 的矢量搜索功能、对现代自然语言处理模型的原生支持、不断简化的数据上线过程,以及精简的安全防护体验,在速度、扩展幅度、相关性和简便性方面,迎来了一个全新的时代。

Video thumbnail
无论是为员工和团队提供重要内容使任务关键型应用程序和基础架构保持在线,还是保护整个数字生态系统免受日益复杂的网络威胁,Elastic 8.0 版都为新一代搜索驱动型解决方案奠定了基础,助力人们达到更高的成就。

准备好开始了吗?Elastic 8.0 版现已在 Elastic Cloud 上正式推出,这是唯一一个包含此最新版所有新功能的托管型 Elasticsearch 产品。

速度、扩展和相关性:同样的基础,崭新的开始

每个旧事物的结束,都会迎来一个新事物的开始。在我们辞旧迎新(再见 2021,你好 2022)之际,我们也在速度、扩展和相关性方面进入了一个全新的 Elastic 8.0 时代。

我们的客户和社区都知道,我们在速度、扩展和相关性方面的承诺矢志不渝。Elastic 的每一个版本都在不断实现功能改进和优化,以确保 Elasticsearch 成为速度更快、更具可扩展性且功能更为强大的搜索引擎。

事实上,在过去的三年间,我们在以下方面取得了长足的进步:减少内存使用(从而让每个节点托管更多的数据),降低查询开销(在大规模部署中成效尤为明显),引入一些全新的功能来提高相关性。

例如,在 7.x 系列版本中,我们提高了日期直方图搜索聚合的速度,增强了页面缓存的性能,并创建了一个新的“pre-filter”搜索短语。此外,我们还通过减少内存堆,完全支持 ARM 架构,引入全新的方式以使用更少的存储空间,以及让我们的客户能够借助新的冻结层和可搜索快照轻松将计算与存储分离开来,从而降低了资源需求(即:降低了客户的总体拥有成本)。

在 Elastic Stack 永无止境的优化中,也许最给力的部分就是,无论您选择何种方式让数据发挥作用,这些改进功能本身都可以帮助您快速且大规模地进行搜索和解决问题,并取得成功,无需到处进行数据收集。

通过原生矢量搜索提高搜索相关性

Elastic 8.0 版引入了一整套原生矢量搜索功能,让客户和员工能够使用他们自己的文字和语言来搜索并收到高度相关的结果。

在过去的两年间,我们一直致力于使 Elasticsearch 成为进行矢量搜索的理想之选。早在 Elasticsearch 7.0 版中,我们就针对高维矢量引入了字段类型。在 Elasticsearch 7.3Elasticsearch 7.4 版中,我们引入了对矢量相似函数的支持。这些早期版本都无不证明了将矢量搜索技术引入 Elasticsearch 生态系统的前景。我们很高兴地看到,我们的客户和社区都竞相在各种各样的用例中采用这些技术。

今天,在 Elasticsearch 8.0 版中,我们将对自然语言处理 (NLP) 模型的原生支持直接引入了 Elasticsearch,让矢量搜索功能更容易实现。此外,Elasticsearch 8.0 版还包含了对近似最近邻 (ANN) 搜索的原生支持,因此可以快速且大规模地比较基于矢量的查询与基于矢量的文档语料库。

借助强大的 NLP 功能打开全新的分析世界

Elasticsearch 始终是执行 NLP 的理想之选,但过去它需要在 Elasticsearch 之外进行一些处理,或编写一些相当复杂的插件。在 8.0 版中,用户现在可以直接在 Elasticsearch 中执行命名实体识别、情感分析、文本分类等,而无需使用额外的组件或进行编码。在 Elasticsearch 中原生计算和创建矢量,不仅在水平可扩展性方面取得了“胜利”(通过在服务器集群中分布计算资源来实现),这一变化还为 Elasticsearch 用户显著节省了时间和精力。
Video thumbnail

在 Elastic 8.0 版中,用户可以直接在 Elasticsearch 中使用 PyTorch Machine Learning 模型(如 BERT),并在 Elasticsearch 中原生使用这些模型执行推理。这些模型可以是您自己的定制模型,也可以是在 Hugging Face 等资源库中向社区发布的模型。

通过支持用户直接在 Elasticsearch 中执行推理,将强大的现代 NLP 功能整合到搜索应用程序和体验变得比以往更加容易(想想看:无需编码),本质上更加高效(得益于 Elasticsearch 的分布式计算功能),而且 NLP 本身的速度也会显著加快,因为您无需将数据移动到单独的进程或系统中。

快速、大规模搜索

因为 Elastic 8.0 版是基于 Lucene 9.0 开发的,那些利用现代 NLP 的搜索体验,都可以借助(新增的)对近似最近邻搜索的原生支持,快速且大规模地实现。通过 ANN,可以快速并高效地将基于矢量的查询与基于矢量的文档语料库(无论是小语料库、大语料库还是巨型语料库)进行比较。


Video thumbnail

想一想这仅仅是个开始…

总而言之,通过对现代 NLP 模型的原生支持,以及对 ANN 搜索的原生支持,Elastic 8.0 版为我们的客户和社区解锁了矢量搜索的功能。如需了解更多信息,请参加我们有关 NLP 模型和矢量搜索的网络研讨会,或阅读随附的有关使用 PyTorch 实现 NLP 的博客

Video thumbnail

将来,搜索驱动型解决方案(如 Elastic 企业搜索)会使利用矢量搜索的功能变得异常简单。在本示例中,用户的搜索词不必与最佳结果完全一样。矢量搜索能够“由点及面”,并轻松搜索出最相关的结果。

简单的事情就该简单做

通过两个新的 Amazon Web Services (AWS) 集成简化云原生可观测性

过去的多个版本中,我们简化了将各类数据从任何来源采集到 Elastic Stack 的过程。在 Elastic 8.0 版中,我们通过以下两个新的 AWS 集成进一步扩展了云原生集成:一个新的 AWS Lambda 应用程序和一个新的 Amazon Simple Storage Service (Amazon S3) Storage Lens 集成。

通过在 AWS Serverless Application Repository (SAR) 中发布的新 AWS Lambda 应用程序,用户可以简化他们的架构并精简数据采集过程,而不需要负担配置虚拟机或安装数据采集器的开销。简而言之,用户现在只需在 AWS 控制台中单击几下,即可将 Amazon S3 的日志采集到他们的 Elastic Cloud 部署中。

Elastic 与 Amazon S3 Storage Lens 集成(12 月首次发布)后,用户可以轻松地将 Storage Lens 指标发送到他们的 Elastic Cloud 部署,从而使用强大的 Elasticsearch 搜索和分析功能以及 Kibana 仪表板功能,优化 Amazon S3 使用成本,确保数据得到保护并监测用户活动趋势。 此外,现在您还可以通过 AWS Marketplace 注册,轻松在 AWS 上开始免费试用 Elastic Cloud。

通过精简的 Stack 安全功能保护数据免受未经授权的访问

适当的安全防护从未像现如今这样重要。虽然安全功能多年来一直是免费包含在 Elastic Stack 中的,但我们还是简化了配置安全功能所需的步骤,因为我们认为任何集群都不应在未受保护的情况下运行。在 Elastic 8.0 版中,现在会默认为自管型集群启用安全功能。这样可确保数据、网络和用户在 Elastic Stack 中受到保护,从而防止数据泄露和未经授权的访问。通过自动生成令牌和证书等产品内的协助,我们对这一流程进行了精简,以便节省时间和精力,让所有人都可以获得安全保障。

此外,如果您已经在使用(或准备好试用)Elastic Cloud,请尽管放心,安全功能和完整的基于角色的访问控制始终处于启用状态。如需阅读有关简化 Stack 安全功能的更多信息,请参阅详细技术博客

立即开始

如上所述,Elastic 8.0 版现已在 Elastic Cloud 上正式推出,这是唯一一个包含此最新版所有新功能的托管型 Elasticsearch 产品。

刚接触 Elastic? 欢迎加入。您现在即可开始使用 Elastic Cloud 的 14 天免费试用版。或者,如果使用托管服务的益处尚未赢得您的青睐,您可以随时免费下载 Elastic Stack 的自管型版本。

本博文所描述的任何功能或特性的发布及上市时间均由 Elastic 自行决定。当前尚未发布的任何功能或特性可能无法按时提供或根本不会提供。