如何部署自然语言处理 (NLP):开始使用
随着 Elastic Stack 8.0 的发布,您能够将 PyTorch Machine Learning 模型上传到 Elasticsearch,从而在 Elastic Stack 中实现现代自然语言处理 (NLP)。NLP 开启了新机遇,让您能够通过密集矢量和近似最近邻搜索完成信息提取和文本分类,并打造更好的搜索体验。
在这个包含多篇博文的系列中,我们将会使用各种 PyTorch NLP 模型带您从头到尾完成几个示例。
第 1 部分:如何部署文本嵌入和矢量搜索
第 2 部分:命名实体识别 (NER)
第 3 部分:情感分析
在每个示例中,我们都会使用来自 Hugging Face 模型中心的预构建 NLP 模型。然后,我们会按照 Elastic 书面说明来部署 NLP 模型并向采集管道中添加 NLP 推理。因为先定义用例并理解将要在模型中处理的文本始终都是一个好办法,所以我们开始时会定义使用 NLP 要实现的目标,还会定义一个共享数据集以便所有人都可以尝试。
完成 NLP 示例的准备工作包括:我们需要一个最低为 8.0 版本的 Elasticsearch 集群,一个至少 2GB 内存的 ML 节点;对于命名实体识别 (NER) 示例,我们必须使用 mapper-annotated-text 插件。入门的最简单方法之一就是在 Elastic Cloud 上通过您自己的免费 14 天试用集群逐步照做,完成这些 NLP 示例。云试用服务可扩展至最大为 2 GB 的 ML 节点,所以您可以随时部署此系列博文中的一到两个示例。