Warum AV-Vertrag und EU-Hosting bei LLMs nicht genügen
Bei der Einführung von KI-Systemen lautet eine der ersten Fragen meist: Wo liegen die Daten?
Diese Frage ist wichtig. Für die Bewertung eines LLM-Systems reicht sie aber nicht aus.
Denn große Sprachmodelle verarbeiten in der Praxis nicht nur einzelne Eingaben. Sie arbeiten häufig mit zusätzlichen Kontexten, Dokumenten, Wissensdatenbanken, Protokolldaten, Tool-Schnittstellen, Memory-Funktionen und weiteren technischen Diensten im Hintergrund. Genau daraus entstehen neue Risiken und neue Abhängigkeiten.
Für Unternehmen bedeutet das: Wer nur auf Hosting-Standort, Standardvertragsklauseln und AV-Vertrag schaut, übersieht oft die entscheidenden Punkte der tatsächlichen Verarbeitung.
Typischer Praxisfehler: „EU-Hosting“ wird mit Kontrolle gleichgesetzt
In Projekten zeigt sich immer wieder dieselbe Annahme: Wenn ein Anbieter europäische Rechenzentren nutzt, sei das datenschutzrechtliche und organisatorische Risiko im Wesentlichen beherrschbar.
Diese Annahme ist zu pauschal.
Denn auch bei EU-Hosting stellen sich unter anderem folgende Fragen:
-
- Wird mit Eingaben, Prompts oder Nutzungssignalen trainiert?
-
- Welche Protokolle entstehen im Betrieb und wer kann darauf zugreifen?
-
- Welche Subdienstleister sind an Moderation, Support, Logging oder Sicherheit beteiligt?
-
- Welche Daten fließen in angebundene Such-, Analyse- oder Produktivitätstools?
-
- Was passiert mit Inhalten, die über Retrieval oder agentische Funktionen nachgeladen werden?
-
- Wie belastbar ist der Ausschluss von Sekundärnutzung tatsächlich geregelt?
Die eigentliche Prüfungsfrage lautet daher nicht nur: Wo wird verarbeitet?
Sondern auch: Wie läuft die Verarbeitung technisch und organisatorisch tatsächlich ab?
Drei typische Fallkonstellationen aus der Praxis
1. Interner KI-Assistent für Mitarbeitende
Ein Unternehmen führt einen internen Assistenten für Recherchen, Zusammenfassungen und Entwürfe ein. Der Anbieter wirbt mit EU-Hosting und DSGVO-Konformität.
Auf den ersten Blick wirkt das sauber. Kritisch wird es aber dort, wo Mitarbeitende im Alltag Vertragsentwürfe, HR-Inhalte, E-Mails, Kundendaten oder interne Bewertungen in das System eingeben. Dann stellt sich nicht nur die Frage des Speicherorts, sondern auch:
-
- Werden Inhalte protokolliert?
-
- Wer kann Support-seitig Einsicht nehmen?
-
- Werden Inhalte zur Qualitätsverbesserung verwendet?
-
- Wie lange bleiben Sitzungsdaten, Logs oder Kontexte erhalten?
-
- Lassen sich sensible Nutzungsszenarien technisch begrenzen?
Das Risiko entsteht hier nicht erst beim Transfer, sondern bereits bei Nutzungsrealität, Rollenverteilung und Protokollierung.
2. LLM mit Unternehmensdokumenten und Wissensdatenbank
Ein Unternehmen bindet Richtlinien, Verträge, Betriebsdokumentation oder Projektdokumente an ein LLM an, um internes Wissen schneller nutzbar zu machen.
In diesem Fall reicht die Frage nach dem Modell selbst erst recht nicht aus. Entscheidend ist dann zum Beispiel:
-
- Welche Dokumente werden indexiert?
-
- Welche Berechtigungen gelten im Retrieval?
-
- Können Nutzer Inhalte sehen, auf die sie eigentlich keinen Zugriff haben sollten?
-
- Werden Suchtreffer, Dokumentausschnitte oder Antworten protokolliert?
-
- Welche Daten werden beim Zusammenspiel von Embeddings, Index, API und Frontend verarbeitet?
Hier liegt das Risiko nicht nur im Modell, sondern in der gesamten Architektur rund um das Modell.
3. KI mit Tool-Anbindung und Agentenfunktionen
Besonders risikoreich wird es, wenn LLMs nicht nur antworten, sondern auf Systeme zugreifen, Aktionen auslösen oder Daten aus Drittsystemen zusammenführen.
Beispiele:
-
- Zugriff auf CRM- oder Ticketsysteme
-
- Auslesen von Postfächern oder Kalendern
-
- Erstellung von Auswertungen aus mehreren Quellen
-
- Übergabe an externe Tools oder Plugins
Spätestens an diesem Punkt wird aus einem KI-Werkzeug eine operative Steuerungskomponente. Dann geht es nicht mehr nur um Datenschutz im engeren Sinn, sondern auch um Berechtigungsdesign, Protokollierung, Sicherheitsarchitektur, Verantwortlichkeiten und Exit-Fähigkeit.
Was Interessenten vor der Auswahl eines Anbieters konkret prüfen sollten
Wer ein LLM-System einführen oder erweitern will, sollte nicht nur Vertragsunterlagen abfragen, sondern die tatsächliche Betriebslogik prüfen.
1. Training und Sekundärnutzung
Wichtig ist nicht nur eine allgemeine Werbeaussage, sondern eine klare Antwort auf diese Punkte:
-
- Sind Kundendaten standardmäßig vom Training ausgeschlossen?
-
- Gilt das für sämtliche Eingaben, Kontexte, Uploads und Metadaten?
-
- Gibt es Opt-in-/Opt-out-Mechanismen?
-
- Gilt der Ausschluss auch für verbundene Dienste und Unterauftragnehmer?
2. Logging und Supportzugriffe
Viele Risiken entstehen in der Praxis nicht im Modelltraining, sondern im Logging.
Zu prüfen ist insbesondere:
-
- Welche Logs werden erzeugt?
-
- Enthalten diese Logs Eingaben oder Antwortinhalte?
-
- Wer hat Zugriff darauf?
-
- Zu welchen Zwecken werden sie verwendet?
-
- Wie lang sind Aufbewahrungsfristen?
-
- Gibt es Mandantentrennung und nachvollziehbare Zugriffskonzepte?
3. Architektur statt nur Anbieterbroschüre
Ein LLM-System sollte nicht nur als Produkt, sondern als Verarbeitungskette betrachtet werden.
Dazu gehören unter anderem:
-
- Modell
-
- API oder Plattform
-
- Frontend
-
- Retrieval-Komponenten
-
- Vektorindex
-
- Safety- und Moderationsschichten
-
- Monitoring und Logging
-
- angebundene Drittsysteme
-
- Support- und Betriebsprozesse
Erst wenn diese Kette sichtbar ist, lässt sich realistisch bewerten, wo Risiken und Abhängigkeiten entstehen.
4. Rollen und Verantwortlichkeiten
In vielen Projekten bleibt unklar, wer welche datenschutzrechtliche und operative Rolle tatsächlich einnimmt.
Deshalb sollte konkret geprüft werden:
-
- Wer ist Verantwortlicher für welche Verarbeitung?
-
- Wo liegt echte Weisungsgebundenheit vor und wo nicht?
-
- Welche Eigenzwecke verfolgt der Anbieter?
-
- Welche Subprozessoren sind eingebunden?
-
- Welche Regelungen gelten für Incident Handling, Support und Produktverbesserung?
5. Exit-Fähigkeit und strategische Abhängigkeit
Ein Punkt wird in Beschaffungsprojekten oft zu spät betrachtet: der spätere Wechsel.
Relevante Fragen sind:
-
- Wie aufwendig wäre ein Anbieterwechsel technisch?
-
- Lassen sich Prompts, Konfigurationen, Workflows und Integrationen migrieren?
-
- Sind Schnittstellen dokumentiert?
-
- Bleibt die Wissensbasis nutzbar?
-
- Wie stark ist das Unternehmen an proprietäre Funktionen gebunden?
Gerade hier zeigt sich, ob ein Unternehmen nur eine Lösung einkauft oder sich strukturell abhängig macht.
Woran man erkennt, dass ein Projekt genauer geprüft werden sollte
Ein vertiefter Review ist spätestens dann sinnvoll, wenn eines oder mehrere dieser Merkmale vorliegen:
-
- Mitarbeitende geben regelmäßig interne oder personenbezogene Inhalte ein
-
- das LLM greift auf Dokumente oder Wissensdatenbanken zu
-
- es bestehen Schnittstellen zu produktiven Drittsystemen
-
- Memory- oder Verlaufsfunktionen sind aktiviert
-
- mehrere Dienstleister sind technisch eingebunden
-
- der Anbieter wirbt pauschal mit „DSGVO-konform“, ohne die Architektur nachvollziehbar offenzulegen
-
- ein späterer Wechsel erscheint nur mit erheblichem Aufwand möglich
Was Unternehmen 2026 organisatorisch anders machen sollten
LLM-Beschaffung sollte nicht allein bei IT oder Rechtsabteilung liegen. In der Praxis sinnvoll ist eine gemeinsame Betrachtung aus:
-
- Datenschutz
-
- Informationssicherheit
-
- Fachbereich
-
- Einkauf/Vendor Management
-
- Governance bzw. Compliance
Denn die entscheidenden Fragen liegen meist zwischen diesen Bereichen: nicht nur Vertrag oder Technik für sich, sondern das Zusammenspiel von Datenflüssen, Berechtigungen, Betriebsmodell und Abhängigkeiten.
Fazit
EU-Hosting ist ein relevanter Baustein. Für die Bewertung eines LLM-Systems ist es aber nur ein Teil der Gesamtfrage.
Entscheidend ist, ob Unternehmen nachvollziehen und steuern können,
-
- welche Daten in das System gelangen,
-
- wie sie dort verarbeitet werden,
-
- welche weiteren Dienste beteiligt sind,
-
- und wie belastbar Kontrolle, Begrenzung und Wechselmöglichkeit tatsächlich ausgestaltet sind.
Genau daran entscheidet sich, ob ein LLM-Einsatz nur formal sauber wirkt oder auch langfristig tragfähig ist.
Beratung gewünscht?
Wir unterstützen Unternehmen bei der Bewertung von LLM-Anwendungen und KI-nahen Betriebsmodellen – insbesondere an den Schnittstellen von Datenschutz, Informationssicherheit, Governance und regulatorischen Anforderungen.
👉 Mehr zu unseren Leistungen in den Bereichen Informationssicherheit, NIS2 und digitale Governance finden Sie hier.
👉 Mehr zu unserer Datenschutz- und Compliance-Beratung erfahren Sie hier.