Was generative KI für Regierungsbehörden und den öffentlichen Sektor leisten kann

Mit Elasticsearch + GAI + Ihren internen Daten finden Sie die missionskritischen Antworten, die Sie brauchen

blog-elastic-GAI-public-sector.jpg

In den letzten Monaten war das Interesse an generativer künstlicher Intelligenz (GAI) enorm. GAI-Anwendungen wie ChatGPT werden rege genutzt und Unternehmen betrachten ihre Möglichkeiten für Kundenerfahrung, Buchhaltung, Marketing und mehr. Bei der rasanten Entwicklung dieser Technologie ist schwer zu sagen, was Spekulation und was schon heute mit Mehrwert umsetzbar ist.

Wir sind nun an einem Punkt, an dem sich Behörden ernsthaft mit der Vorbereitung interner Daten für die optimale Nutzung von GAI und der Anwendung der Technologie für eine bessere Erfahrung für Bürger und Mitarbeiter auseinandersetzen sollten.

GAI ist nur so gut wie die Daten, mit denen sie trainiert wird

Derzeit kann GAI eindrucksvolle Inhalte, Unterhaltungen, Bilder und mehr erstellen. Aber diese Ergebnisse sind nur so relevant wie die Daten, mit denen das Tool trainiert wurde. Wenn die Trainingsdatensätze, die in Large Language Models (LLMs) den Anschein von Wissen erwecken, auf öffentlich im Internet verfügbaren Daten basieren, sind die generierten Antworten begrenzt. Auf öffentlichen Daten basierende GAI neigt oft zu Halluzinationen – falschen Informationen, die als korrekt dargestellt werden.

Andererseits kann GAI bei Verwendung mit den internen Daten einer Behörde Ergebnisse erheblich beschleunigen, Bürgerdienstleistungen verbessern und behördlichen Wissensarbeitern wie Analysten und Fachkräften für Cybersicherheit die richtigen Daten zur richtigen Zeit an die Hand geben. Warum? Weil diese Behördendaten wesentlichen Kontext bieten.

Die Kombination von GAI und privaten Behördendaten wirkt als Multiplikator. Die naive Herangehensweise wäre es, private Daten in die Modelle selbst einzufügen; die Komplexität und Kosten für Training oder Feineinstellung von KI-Modellen, multipliziert mit der Anzahl an Domänen und Interaktionspunkten in der Verwaltung, werden jedoch untragbar. Stattdessen können dieselben Fragen an das LLM zunächst an die KI-gestützten Suchfunktionen von Elastic geleitet werden, wo die relevanteste faktenbasierte Antwort auf Grundlage Ihrer internen Daten gefunden werden kann.

Dieser domänenspezifische Kontext, den Ihre Daten in die GAI bringen, können die Ausgabe genauer, relevanter und für Ihre Ziele umsetzbarer machen. Voraussetzung dafür, dass Sie „Ihre eigenen Daten mitbringen“ können, ist eine einheitliche Datenplattform, von der aus sie abrufbar und auffindbar sind.

Wie sieht es mit Datenschutz und Sicherheit aus?

Insbesondere im öffentlichen Sektor dürfen hochsensible Daten nicht mit öffentlich zugänglichen GAI oder beliebigen anderen Systemen vermengt werden, bei denen die Kontrolle über die eigenen Daten abhandenkommt. Jede Suchanfrage, die an ein öffentlich zugängliches GAI-Produkt (wie ChatGPT) gesendet wird, wird vom Modell aufgenommen. Das bedeutet, dass Ihre internen Daten nicht mehr intern sind. Selbst wenn GAI kein offizieller Teil des Technologie-Stacks Ihrer Organisation ist, können Sie davon ausgehen, dass Ihre Mitarbeiter sie dennoch nutzen.

Helfen Sie sicherzustellen, dass Ihre internen Daten in den richtigen Händen bleiben: Integrieren Sie GAI strategisch mit Ihren proprietären Daten, sodass Ihr IT-Team die Kontrolle und Übersicht behält. Andernfalls kann es vorkommen, dass Ihre Mitarbeiter unabsichtlich Ihre sensiblen Daten in öffentliche GAI-Dienste wie ChatGPT einfügen, wo Sie ihren Schutz nicht mehr gewährleisten können. Ideal ist eine Integration Ihrer proprietären Daten in eine Plattform, die auf sensible Informationen zugeschnitten ist, mit der Sie die volle Kontrolle über Ihre Daten behalten und die eine rollenbasierte Zugriffssteuerung (RBAC) ermöglicht. Mehr dazu weiter unten.

Mit GAI schneller ans Ziel

Daten zählen zu den strategisch bedeutendsten Assets für Organisationen im öffentlichen Sektor. Wenn Ihre Daten einheitlich in einer Plattform gespeichert sind, wo sie mit GAI und Suchtechnologen genutzt werden können, ergeben sich in der Praxis vielfältige Vorteile wie:

Personalisierter Zugriff auf öffentliche Dienstleistungen

Stellen wir uns vor, dass eine Person einen Antrag auf eine kommunale Wohnung stellen möchte. Das Verfahren umfasst mehrere Schritte und Formulare, die sich je nach Bedürfnissen und Ort unterscheiden. Eine einfache Auflistung generischer Informationen auf einer Website wäre komplex und würde der individuellen Situation nicht gerecht werden. Wenn Behörden jedoch ihre eigenen Daten mit GAI verbinden, können Menschen Informationen und Anweisungen erhalten, die genau auf ihre spezifischen Umstände zugeschnitten sind. Diese hochrelevanten Informationen haben das Potenzial, die Komplexität zu verringern, wegen der viele Menschen solche Dienstleistungen überhaupt nicht wahrnehmen.

Vereinfachungen für Bürger

Ein anderes Beispiel, das in den USA relevant ist: Sie sollen vor Gericht Teil der Jury sein und müssen herausfinden, wie es weitergeht. Wo müssen Sie hin? Wie lang dauert das? Wurden Sie als Jurymitglied ausgewählt? Erlaubt der Richter Handys im Gerichtssaal? Unter Nutzung Ihrer Daten kann GAI diese komplexen Informationen optimiert aufbereiten und personalisieren, was das Verfahren für die Bürger potenziell vereinfacht und das Vertrauen in Behörden und Vertreter stärkt.

Genauere Untersuchungen und Informationen

Für Strafverfolgungsbehörden und Geheimdienste ist demokratisierter Echtzeitzugriff auf die korrekten Daten entscheidend. Das gilt insbesondere dann, wenn mehrere Einrichtungen an einem Projekt zusammenarbeiten – mit unterschiedlichen Datenbanken mit Informationen in verschiedenen Formaten. Die Möglichkeit, mit einer GAI-Abfrage Antworten über unterschiedliche Datentypen und Quellen hinweg zu finden, kann zu schnelleren und genaueren Ergebnissen führen, zeitraubende manuelle Arbeit verringern und sicherstellen, dass alle relevanten Parteien mit demselben genauen Datensatz arbeiten können.

Bessere Mitarbeiterproduktivität

Wenn Sie GAI mit domänenspezifischem Kontext integrieren, ermöglichen Sie es Ihren internen Teams damit, rasch die Informationen zu finden, die sie für ihre Aufgaben brauchen. Eine schnelle Abfrage über mehrere Datensätze und Formate hinweg kann äußerst relevante Informationen in Echtzeit liefern. Es entfällt die zeit- und kraftraubende Suche durch Dokumente oder Datenbanksilos. In den meisten Fällen sind die Informationen, die Ihre Teams brauchen, nicht im öffentlichen Internet oder in Trainingsdatensätzen für KI-Modelle zu finden. Daher ist es wichtig, ein GAI-gestütztes Tool zum schnellen Auffinden proprietärer Informationen zur Verfügung zu stellen, damit Ihre Mitarbeiter kein öffentliches Tool nutzen, das ein Risiko für Ihre Datensicherheit darstellen kann.

Wenn Mitarbeiter weniger Zeit für ergebnislose Suchen und manuelle Datenkorrelation aufwenden, entfernen Sie einen weiteren Reibungspunkt im täglichen Ablauf, was die Jobzufriedenheit und das Engagement erhöht – insbesondere, wenn die Ressourcen ohnehin knapp sind.

GAI + Elasticsearch + Ihre internen Daten

Die Elasticsearch Plattform ist ein leistungsstarkes Tool bei der Integration der Daten Ihrer Behörde mit GAI. Sie ermöglicht Ihnen, alle möglichen Datentypen zu ingestieren, sie kostengünstig zu speichern, sie an ihrem Speicherort aufzurufen und sie mit GAI-Transformer-Modellen zu integrieren.
Elastic arbeitet bereits seit mehr als zehn Jahren daran, die Suche zu demokratisieren, und einen Großteil dieses Zeitraums haben wir in KI und Machine Learning (ML) investiert. Das Ergebnis ist unsere neu eingeführte Elasticsearch Relevance Engine (ESRE), mit der unsere Kunden mittels KI und ML auf der Elasticsearch Plattform relevante Ergebnisse auf ihre Fragen erhalten.

Was ist die Elasticsearch Relevance Engine (ESRE)?

ESRE kombiniert die Vorteile der KI mit der Textsuche von Elastic und bietet die Möglichkeit zur Integration mit Large Language Models (LLMs). Die Lösung ist über eine einfache und einheitliche API verfügbar, der die Elastic-Community bereits vertraut, und Entwickler können sofort damit anfangen, ihre Suchrelevanz zu verbessern.

Anders ausgedrückt: Sie können nun Ihr eigenes GAI-Modell oder ein GAI-Modell eines Drittanbieters direkt mit den Daten verbinden, die Sie in der Elasticsearch Plattform speichern. So können Sie die Möglichkeiten von GAI mit domänenspezifischen Daten nutzen, um genaue, relevante, umsetzbare und sichere Antworten zu erhalten.

Weitere Informationen zu ESRE finden Sie in unserem Blogpost zum Launch.

Warum Elasticsearch für GAI und private Daten?

1. Einheitliche Datenspeicherung und demokratisierter Zugriff. Sie können alle Ihre Daten kostengünstig in der Elasticsearch Plattform speichern und erhalten demokratisierten Zugriff, demokratisierte Einblicke und machen die Daten auffindbar. Sobald Ihre Daten in der Plattform sind, können Sie sie für weitere Anwendungsfälle wie Bedrohungsabwehr und Infrastrukturüberwachung nutzen.

2. Die missionskritischen Antworten, die Sie erhalten, sind:

  • Genau: Faktenbasierte, relevante Antworten mittels GAI und Ihrer eigenen Daten statt Halluzinationen.
  • Relevant: Mit Ihren proprietären Daten in Elasticsearch entfällt das wiederholte Training von LLMs mit Ihren internen Daten, was Zeit und Kosten spart und sicherstellt, dass Ihre Informationen stets aktuell sind.
  • Umsetzbar: Die Elasticsearch Plattform demokratisiert den Zugriff auf Daten und Einblicke. Ihre Teams können so von überall aus in Echtzeit zusammenarbeiten und Entscheidungen treffen.
  • Sicher: Nicht alle Mitarbeiter brauchen Zugriff auf jedes Dokument und bestimmte Daten müssen aus Gründen der Datenhoheit an bestimmten Orten lagern. Elasticsearch ermöglicht die Zugriffsbeschränkung auf Daten auf bestimmte Rollen in Ihrer Organisation, wobei die Möglichkeit zur Suche in Ihrem gesamten Datenspeicher unangetastet bleibt.

3. Kostengünstige Implementierung. Basierend auf jahrzehntelangen Optimierungen ist der Wissensabruf über GAI-Interaktionen mit Elasticsearch hinsichtlich Rechenleistung um ein Vielfaches effizienter als der Abruf derselben Informationen über trainierte oder verfeinerte LLMs. Einigen Schätzungen zufolge ist der semantische Abruf fünfmal effizienter als nur ChatGPT 3.5; die CPU-Kosten für GPT-4 sind 250 Mal höher.

Wie viel Mehrwert GAI für Ihre Organisation schaffen kann, hängt von Ihren Daten ab sowie davon, ob sie vereinheitlicht und abrufbar sind. Wenn Ihre Daten über mehrere Tools und Teams verteilt sind, fehlen Ihnen möglicherweise Kontext und Inhalte, mit denen eine auf Relevanz optimierte Anwendung von GAI für Ihre Missionsziele möglich wäre. Die Elasticsearch Plattform dient als einheitlicher Datenspeicher für alle Daten Ihrer Behörde und als zentraler Startpunkt für Zusammenarbeit, KI-Einblicke und Automatisierung.

Wie geht es weiter?

In diesem Blogpost haben wir möglicherweise generative KI-Tools von Drittanbietern verwendet oder darauf Bezug genommen, die von ihren jeweiligen Eigentümern betrieben werden. Elastic hat keine Kontrolle über die Drittanbieter-Tools und übernimmt keine Verantwortung oder Haftung für ihre Inhalte, ihren Betrieb oder ihre Anwendung sowie für etwaige Verluste oder Schäden, die sich aus Ihrer Anwendung solcher Tools ergeben. Gehen Sie vorsichtig vor, wenn Sie KI-Tools mit persönlichen, sensiblen oder vertraulichen Daten verwenden. Alle Daten, die Sie eingeben, können für das Training von KI oder andere Zwecke verwendet werden. Es gibt keine Garantie dafür, dass Informationen, die Sie bereitstellen, sicher oder vertraulich behandelt werden. Setzen Sie sich vor Gebrauch mit den Datenschutzpraktiken und den Nutzungsbedingungen generativer KI-Tools auseinander.

Elastic, Elasticsearch, ESRE, Elasticsearch Relevance Engine und zugehörige Marken, Waren- und Dienstleistungszeichen sind Marken oder eingetragene Marken von Elastic N.V. in den USA und anderen Ländern. Alle weiteren Marken- oder Warenzeichen sind eingetragene Marken oder eingetragene Warenzeichen der jeweiligen Eigentümer.