内容和数据采集
成功离不开索引
Elastic 提供了针对所有类型的数据和内容构建强大又灵活的采集机制所需的所有工具,包括开箱即用型的工具或 API。您可以快速进行设置,并有大量选项可供您视情况来丰富、转换和处理数据,以便您专注于构建功能强大的搜索应用程序。
数据采集引擎
多样性是采集的一部分
借助功能强大、预构建但完全可配置的数据采集工具和公开的 API,您可按照自己的方式索引和管理数据,从而完全控制采集管道。
数据提取
在所有网站内容中进行查找、提取、索引和同步 — PDF 也会包括在内!使用 Elastic 的网络爬虫,将网页转换为可搜索的数据。
数据连接器
利用可与流行的效率工具关联的原生连接器和连接器客户端,以及方便获取的 API,为您的数据源构建连接器。
采集 API
借助合适的索引终端,使用 JavaScript、Java 和 Python 等主流语言客户端,构建定制采集管道。
数据管道
使用现有的 Elasticsearch 索引或 Elasticsearch 查询语法,将数据采集管道和管理部署到位。
向网站添加搜索功能
对网页内容进行索引最快的方式
无论您使用的是直观的 UI 还是灵活的 API,或者两者兼有,您都可以按照自己喜欢的方式配置爬取。由于您对爬取活动和历史记录一目了然,因此可以清楚地了解索引性能。