Wer in einer Behörde KI beschaffen oder betreiben will, bewegt sich in einem dichten Geflecht aus DSGVO- und KI-Verordnungspflichten. Der Bayerische Landesbeauftragte für den Datenschutz hat mit der Reihe „AI in a nutshell“ inzwischen drei kompakte Checklisten veröffentlicht, die speziell für öffentliche Stellen die wichtigsten datenschutzrechtlichen Anforderungen für drei zentrale Anwendungsfälle strukturieren: RAG-Systeme, KI-Sprachübersetzungstools und LLM-gestützte Chatbots.

Newsletter-Anmeldung

Der Bayerische Landesbeauftragte für den Datenschutz (BayLfD) hat die Reihe „AI in a nutshell“ als kompakte Ergänzung zu seiner umfassenden Orientierungshilfe „Datenschutz bei KI-Projekten in der bayerischen Verwaltung“ (Stand März 2026) konzipiert. Die drei Handreichungen liefern jeweils drei bis vier Seiten strukturierten Handlungsbedarf zu konkreten KI-Anwendungsszenarien. Auch wenn sich die Veröffentlichungen vorrangig an bayerische öffentliche Stellen richten, sind die Hinweise auch darüber hinaus als Orientierung nutzbar.

Handreichung 1: Anbindung eines RAG-Subsystems

Retrieval Augmented Generation (RAG) ermöglicht es, einem KI-Sprachmodell externe Datenquellen – etwa Dokumentensammlungen oder Datenbanken – zugänglich zu machen, ohne diese ins Modell selbst zu integrieren. Die Datenquellen werden dazu in Textabschnitte (Chunks) aufgeteilt, per KI-Embedding-Modell in Vektoren überführt und in einer Vektordatenbank gespeichert. Bei einer Nutzereingabe wird die Anfrage ebenfalls vektorisiert, passende Dokumente werden per semantischer Ähnlichkeitssuche gefunden und dem Sprachmodell als Kontext übergeben.

Für öffentliche Stellen ist dieses Verfahren besonders attraktiv, weil sich behördeninterne oder sich häufig ändernde Datenquellen ohne Neutraining schnell einbinden lassen und bei mandantengetrenntem Betrieb keine internen Informationen an andere Nutzer desselben Modells gelangen.

Der BayLfD benennt drei datenschutzrechtliche Schwerpunkte:

Personenbezogene Daten in den RAG-Quellen: Enthalten die angebundenen Datenquellen Personenbezüge – und das gilt bereits für Autorennamen in Metadaten von Word- oder PDF-Dateien –, findet das Datenschutzrecht auf alle Verarbeitungsvorgänge Anwendung: von der Erhebung und Aufbereitung über das Embedding bis zur Ergebnisausgabe. Die Quellen sind vor der Anbindung gezielt zu prüfen, zu kuratieren und gegebenenfalls zu anonymisieren.

KI-gestütztes Embedding: Aus Vektoren lassen sich per semantischer Ähnlichkeitssuche Rückschlüsse auf die zugrundeliegenden Inhalte ziehen; sie gelten daher weiterhin als personenbezogene Daten. Erforderlich sind Maßnahmen zum Schutz der Vektordatenbank vor unbefugtem Zugriff sowie eine Risikobetrachtung, die alle im RAG-System eingesetzten KI-Modelle berücksichtigt.

Informationspflichten und Betroffenenrechte: Die mittels RAG angebundenen Datenquellen lassen sich durch die einsetzende Stelle steuern und damit rechtskonform gestalten. Herausforderungen bestehen dagegen weiterhin hinsichtlich der Informationspflichten gegenüber Betroffenen und der Grundsätze der Rechtmäßigkeit, Transparenz und Zweckbindung im Hinblick auf das RAG-System und seine KI-Modelle insgesamt – hier ist regelmäßig Unterstützung durch den jeweiligen Anbieter vertraglich abzusichern.

Handreichung 2: KI-basierte Sprachübersetzungstools

Sprachübersetzungstools auf KI-Basis sind gerade im kommunalen Bereich ein wachsendes Einsatzfeld: Sie stehen rund um die Uhr zur Verfügung, übersetzen gesprochenes und geschriebenes Wort sowie ganze Dokumente in eine Vielzahl von Sprachen und können den Bürgerkontakt erleichtern. Datenschutzrechtlich sind sie in der Regel als Betriebsmittel einzustufen.

Der BayLfD identifiziert drei besonders relevante Fragestellungen:

Personenbezogene Daten und Stimmprofile: Ein Sprachübersetzungstool verarbeitet nicht nur die zu übersetzenden Inhalte, sondern kann auch Stimmprofile erheben. Werden Sprachdaten zum Zweck der eindeutigen Identifizierung einer Person verarbeitet, fallen sie als biometrische Daten unter Art. 9 DSGVO mit seinen erhöhten Rechtmäßigkeitsanforderungen. Zusätzlich entstehen Anmeldedaten und Metadaten („Betriebsmitteldaten“), die ebenfalls Personenbezüge aufweisen können. Für alle Verarbeitungsvorgänge – vom Training über die Eingabe bis zur Weiternutzung der Daten – sind Verantwortlichkeiten zu klären, Rechtsgrundlagen zu prüfen und gegebenenfalls Auftragsverarbeitungsverträge abzuschließen. Ein Weitertraining des Modells mit Behördendaten dürfte regelmäßig keine ausreichende Rechtsgrundlage haben.

Besondere Kategorien personenbezogener Daten: Werden Tools zur Kommunikation mit Bürgerinnen und Bürgern etwa bei Gesundheits- oder Sozialämtern eingesetzt, ist regelmäßig mit Gesundheitsdaten nach Art. 9 DSGVO zu rechnen. Auch der Akzent oder Sprachfehler einer Person kann die ethnische Herkunft offenbaren. Vor dem Einsatz sind der Anwendungsbereich und die Modalitäten der Nutzung entsprechend zu beschränken oder geeignete Rechtsgrundlagen nach Art. 9 Abs. 2 DSGVO sicherzustellen.

Qualität und Richtigkeit der Übersetzungen: Art. 5 Abs. 1 lit. d DSGVO verlangt sachlich richtige Daten. Öffentliche Stellen müssen daher die Qualität der KI-Übersetzungen regelmäßig kontrollieren und sicherstellen, dass sie der Leistung eines Dolmetschers entsprechen. Wo fachgesetzliche Bestimmungen einen vereidigten Dolmetscher vorschreiben, ist darüber hinaus zu prüfen, ob der Einsatz einer Maschine dem Grunde nach zulässig ist.

Handreichung 3: LLM-gestützte Chatbots

LLM-gestützte Chatbots stellen Behörden vor ein besonders dichtes Pflichtenprogramm, weil sie die gesamte Nutzungsphase von der Beschaffung über die Implementierung bis zum laufenden Betrieb abdecken. Der BayLfD strukturiert die Anforderungen in drei Phasen:

Beschaffung: Bereits im Vorfeld einer Ausschreibung ist zu klären, ob und in welchem Umfang die geplante Nutzung eine Verarbeitung personenbezogener Daten erfordert. Gleichzeitig sind grundlegende Architekturentscheidungen zu treffen: offenes oder abgeschottetes System, Anbindung eines RAG-Subsystems, cloudbasierte oder On-Premises-Infrastruktur. Für alle Konstellationen, in denen ein externer Anbieter personenbezogene Daten verarbeitet, ist der Abschluss eines Auftragsverarbeitungsvertrags nach Art. 28 Abs. 3 DSGVO zu prüfen.

Implementierung: Bei der Einführung sind das Verarbeitungsverzeichnis und – bei entsprechendem Risiko regelmäßig – eine Datenschutz-Folgenabschätzung zentrale Dokumentationspflichten. Nach Art. 50 Abs. 1 KI-Verordnung müssen externe Nutzende darüber informiert werden, dass sie mit einer Maschine interagieren. Technisch empfiehlt der BayLfD das Deaktivieren von Nachtraining mit Eingabedaten sowie der Chat-Historie; für die behördeninterne Nutzung kommen Funktionsaccounts zur Datenminimierung sowie Dienstanweisung und Schulungen hinzu.

Nutzung: Im laufenden Betrieb sind die Datenschutzmaßnahmen regelmäßig zu überprüfen. Chatbot-Ausgaben sind insbesondere auf Diskriminierungsfreiheit, Richtigkeit und Vollständigkeit sowie auf etwaigen Personenbezug zu kontrollieren.

Quellen

Alle drei Handreichungen sind auf der KI-Seite des BayLfD frei zugänglich, ebenso die zugehörige Orientierungshilfe „Datenschutz bei KI-Projekten in der bayerischen Verwaltung“ (Stand März 2026).

Titelbild: Christoph Meinersmann – Pixabay