生成式 AI 对政府和公共部门的影响

利用 Elasticsearch + GAI + 您的内部数据,找到所需的任务关键型答案

blog-elastic-GAI-public-sector.jpg

在过去的几个月里,人们对生成式人工智能 (GAI) 产生了极大的兴趣。人们正在尝试使用 ChatGPT 等 GAI 应用程序,企业也在思考它对客户体验、会计、营销等方面的影响。由于这项技术发展迅猛,很难判断哪些是推测性内容,哪些是如今真正可以实现且有价值的内容。

现在,政府领导人应该认真考虑如何准备内部数据,以便从 GAI 中获得最大价值,以及如何利用 GAI 为居民和员工提供更好的生活和工作体验。

GAI 本身的能力取决于训练时所使用的数据

在目前的状态下,GAI 可以生成令人印象深刻的内容、对话、图像等。但这些结果只与该工具训练时所使用的数据相关。如果训练数据集(在大型语言模型 (LLM) 内提供知识呈现)是基于互联网上的公开数据,那么它们生成的答案就很有局限性。基于公开数据的 GAI 往往容易产生错觉,将不正确的信息当作准确的信息来呈现。

另一方面,当 GAI 与机构的内部数据配合使用时,它可以显著加快产出任务成果,改善居民服务,更好地帮助政府知识型员工(如分析师和网络安全专业人员)在正确的时间找到正确的数据。为什么?因为这些机构数据增加了必要的背景信息。

GAI 与机构私有数据的结合产生了倍增效应。如果是缺乏经验的解决方案,会将私有数据嵌入模型本身当中;然而,训练或微调 AI 模型很复杂,成本也很高,再加上政府所涉及领域和互动点的数量,就变得难以维持。反过来看,向 LLM 提出的相同问题可以先交给 Elastic 基于 AI 的搜索功能,它会根据您的内部数据找到相关度最高且基于事实的答案。

您的数据为 GAI 带来的这种领域特定的背景信息,可以使输出更准确、相关度更高、更适合您的任务来操作。“自带数据”的先决条件是,您的数据存储在一个统一的数据平台中,可以在同一个位置访问和查找数据。

隐私和安全性如何?

对于公共部门来说,您尤其不希望将高度敏感的数据与可公开访问的 GAI(或者任何您不能控制自己数据的系统)混在一起。发送到公开可用的 GAI 产品(如 ChatGPT)的任何搜索查询都会由该模型使用,这意味着您的内部数据不再是内部数据。即使您的组织没有正式将 GAI 用作技术堆栈的一部分,但可以肯定的是,您的员工无论如何都会使用它。

通过战略性地将 GAI 与专有数据整合在一起,让 IT 团队能够控制并深入了解内部数据,从而确保内部数据始终掌握在正确的人手中。否则,员工可能会无意中将敏感数据放入 ChatGPT 这样的公共 GAI 服务中,无法确保数据的安全性。理想情况下,您可以将专有数据整合到一个专用于处理敏感信息的平台中;在这个平台中,您可以始终完全控制自己的数据,实现基于角色的访问控制 (RBAC)。下文将详细介绍这一点。

通过 GAI 加快打造任务影响力

如今,数据是公共部门组织拥有的最具战略意义的资产之一。如果将数据统一存储在一个平台上,再利用 GAI 和搜索技术,这会带来深远的实际影响,提供的好处包括:

按个性化方式访问公共服务

设想有一位居民要申请公共住房服务。申请过程涉及若干个步骤和表格,这些步骤和表格因需求和地点而异。仅仅是在网页上列出通用信息都会很复杂,而且很可能无法处理居民的特殊情况。但是,如果机构将自己的数据提供给 GAI,居民就可以找到适合他们个人情况的信息和说明。这种高度相关的信息可能会降低复杂性,不再阻碍人们访问必要的服务。

简化居民体验

或者,再举个例子:您被传唤去当陪审员,您需要知道接下来会发生什么。需要去哪里?需要多长时间?自己是被选为陪审员了吗?法官允许在法庭上使用手机吗?利用您的数据,GAI 可以简化这些复杂的信息并对其进行个性化设置,潜在地改善居民体验,建立对政府服务和领导者的信任。

准确的调查和情报

对于执法和情报这个团体来说,实时民主化地访问正确的数据是很重要的。当多个组织协作处理一个项目时,尤其如此,因为会使用各种不同格式的信息数据库。如果能够通过单一的 GAI 查询在各种数据类型和来源中找到答案,就有可能提高获得结果的速度和准确性,减少手动和耗时的工作,并确保每个有需求的人都可以使用相同的准确数据集。

提高员工的工作效率

将 GAI 与领域特定的上下文整合在一起后,可以帮助内部团队快速找到完成工作所需的信息。在多个数据集和多种格式的数据中快速查询,可以实时提供高度相关的信息,无需费力地(绞尽脑汁地)梳理文档或孤立的数据库。此外,在大多数情况下,团队要寻找的信息无法在公共互联网或 AI 模型训练集中找到,因此提供一个基于 GAI 的工具来快速查找专有信息十分有必要,这样员工就不会转向可能会威胁到数据安全的公共工具。

如果员工减少了花费在徒劳的搜索和手动数据关联上的时间,他们的日常工作就又少了一个摩擦的源头,为提高工作满意度和参与度铺平了道路,尤其是在一开始就资源紧张的情况下。

GAI + Elasticsearch + 您的内部数据

如果考虑将机构数据与 GAI 整合,可以使用 Elasticsearch 平台这个强大的工具。使用 Elasticsearch,您可以采集各种类型的数据,以经济的方式存储数据,无论数据位于何处,都可以进行访问,还可以将数据与 GAI 转换器模型整合在一起。
十多年来,Elastic 一直致力于实现搜索的民主化,我们也已经在 AI 和 Machine Learning (ML) 领域进行了大量投入。因此,我们刚刚推出了 Elasticsearch Relevance Engine (ESRE),旨在帮助我们的客户在 Elasticsearch 平台上通过 AI 和 ML 找到针对问题高度相关的答案。

Elasticsearch Relevance Engine (ESRE) 是什么?

ESRE 将 AI 的优点与 Elastic 的文本搜索相结合,提供了与大型语言模型 (LLM) 集成的能力。ESRE 还可以通过深受 Elastic 社区信任的简单、统一的 API 进行访问,因此开发人员可以立即开始使用它来提升搜索相关性。

换句话说,您现在可以将自己的 GAI 模型或第三方 GAI 模型直接连接到您存储在 Elasticsearch 平台中的数据。这样一来,您就可以利用 GAI 的强大功能和领域特定的数据来生成准确、相关度高、可操作和安全的答案。

要进一步了解 ESRE,请阅读发布博客

为什么选择将 Elasticsearch 用于 GAI 和私有数据?

1.统一的数据存储和民主化访问。您可以经济实惠地将所有数据存储在 Elasticsearch 平台中,以实现民主化访问、可查找性和洞察力。一旦将数据放入平台中,您就可以将数据用于其他用例,例如威胁猎捕和基础架构监测。

2.能够找到任务关键型答案,且答案具备以下特征:

  • 准确:您从 GAI 和自己的数据中得到的答案是基于与任务相关的事实,而不是幻觉。
  • 相关度高:在 Elasticsearch 中使用专有数据,可以避免对内部数据反复重新训练 LLM,节省时间和训练成本,并确保信息始终是最新的。
  • 可操作:Elasticsearch 平台实现了数据和见解的访问民主化,让团队能够随时随地进行实时协作并做出决策。
  • 安全:并非每位员工都能访问每个文档,出于数据主权的目的,某些数据需要驻留在特定的位置。借助 Elasticsearch,您可以限制对组织内某些角色的数据访问权限,同时仍保留在整个数据存储中进行搜索的能力。

3.实现过程经济高效。由于在信息检索方面已经进行了数十年的优化,Elasticsearch 向 GAI 交互呈现知识的方式比从经过训练或经过优化的大型语言模型中提取相同知识的 CPU 效率高了一个数量级。一些预测数据表明,语义检索的效率是只使用 ChatGPT 3.5 时的五倍,而 CPU 成本却是 GPT-4 的 250 分之一。

GAI 能为您的组织创造多少价值取决于您的数据,以及数据是否经过统一管理,是否可访问。如果您的数据分散在多个工具和团队中,可能会缺少背景信息和内容,而这正是使 GAI 与您的任务目标高度相关所必需的。Elasticsearch 平台是您机构所有数据的单一数据存储平台,也是协作、钻取 AI 见解和自动化的集中起点。

后续步骤

在本博文中,我们可能使用或提到了第三方生成式 AI 工具,这些工具由其各自所有者拥有和运营。Elastic 对第三方工具没有任何控制权,对其内容、操作或使用不承担任何责任或义务,对您使用此类工具可能造成的任何损失或损害也不承担任何责任或义务。在 AI 工具中使用个人、敏感或机密信息时,请务必谨慎。您提交的任何数据都可能用于 AI 训练或其他目的。Elastic 不保证您所提供信息的安全性或保密性。在使用任何生成式 AI 工具之前,您应自行熟悉隐私惯例和使用条款。

Elastic、Elasticsearch、ESRE、Elasticsearch Relevance Engine 及相关标志为 Elasticsearch N.V. 在美国和其他国家/地区的商标、徽标或注册商标。所有其他公司和产品名称均为其相应所有者的商标、徽标或注册商标。