Die Sicherheit von AI-„Mitarbeitern“

20. April 2026

Die Sicherheit von KI-„Mitarbeitern“ wird oft auf die Frage von Zugriffsrechten reduziert: Wer hat unter welchen Bedingungen Zugriff auf was? In der Praxis zeigt sich jedoch, dass Zugriffskontrolle allein die größten Risiken beim Einsatz von KI nicht abdecken kann. Modelle und Agenten fungieren heute nicht nur als passive Werkzeuge, sondern als aktive Teilnehmer von Prozessen — sie kombinieren Daten aus verschiedenen Quellen, treffen Entscheidungen und führen in vielen Fällen selbstständig Aktionen aus. Sicherheit muss daher nicht nur um den Zugriff herum gestaltet werden, sondern vor allem um die Absicht (Intent) und die Nachvollziehbarkeit jedes einzelnen Schritts.

Ein zentraler Baustein dieses Ansatzes ist die klare Definition sensibler Datenbereiche. Organisationen müssen genau wissen, wo sich kritische Informationen befinden, wie sie klassifiziert sind und wie sie zwischen Systemen fließen dürfen. KI sollte niemals mehr Kontext erhalten, als für die jeweilige Aufgabe notwendig ist. Dieses Prinzip des „Least Context“ ergänzt das klassische „Least Privilege“ und berücksichtigt, dass selbst scheinbar harmlose Datenkombinationen sensible Informationen offenlegen können. In der Praxis bedeutet dies die Einführung von Kontrollschichten, durch die alle Datenanfragen der KI laufen und in denen Richtlinien wie Filterung, Maskierung und Protokollierung angewendet werden.

Eng damit verbunden ist die Reduktion und Maskierung von Daten. Moderne KI-Systeme benötigen oft keine vollständigen Dokumente oder identifizierbaren Daten; ein abstrahierter oder anonymisierter Kontext genügt. Automatische Schwärzung personenbezogener Daten, Tokenisierung sensibler Elemente und dynamische Transformationen vor der Verarbeitung reduzieren das Risiko von Datenlecks erheblich. Wichtig ist, dass diese Prozesse in Echtzeit erfolgen und keine dauerhaften Kopien sensibler Daten in weniger sicheren Umgebungen erzeugen.

Ein wesentlicher Vertrauensfaktor ist die Nachvollziehbarkeit der Herkunft von Daten und Entscheidungen, die sogenannte Provenienz. Jede KI-Ausgabe sollte von Metadaten begleitet sein, die Datenquellen, Transformationen, Modellversion und eingesetzte Werkzeuge beschreiben. Solche Protokolle müssen unveränderlich und manipulationssicher gestaltet sein, etwa durch Append-only-Mechanismen oder kryptografische Signaturen. Ohne diese Ebene sind Audits, Incident Response und Compliance kaum möglich.

Besondere Aufmerksamkeit ist erforderlich, wenn KI von Empfehlungen zu Aktionen übergeht. In solchen Fällen müssen Genehmigungsmechanismen die Risiken der jeweiligen Aktion berücksichtigen. Ein Human-in-the-loop-Ansatz stellt sicher, dass kritische Vorgänge — etwa der Umgang mit Finanzdaten oder der Export sensibler Informationen — von Menschen freigegeben werden. Vor der Ausführung sollte das System die Absicht der KI in Form eines klaren Plans darstellen: was getan werden soll, warum und mit welchen Konsequenzen. Dadurch verschiebt sich die Kontrolle von „was ist erlaubt“ hin zu „was ist im Kontext sinnvoll“.

Ebenso wichtig ist die Trennung von Umgebungen. Die Vermischung von Entwicklungs-, Test- und Produktionsdaten ist eine häufige Ursache von Sicherheitsvorfällen. KI-Systeme sollten in strikt getrennten Umgebungen betrieben werden, wobei der Zugriff auf Produktionsdaten streng kontrolliert wird und in nicht-produktiven Phasen anonymisierte oder synthetische Daten verwendet werden. Neue Funktionen sollten schrittweise eingeführt werden, etwa mittels Canary Deployments oder Feature Flags.

Ein weiterer kritischer Bereich ist das Management von Geheimnissen. API-Schlüssel, Tokens und Zugangsdaten dürfen KI-Modellen niemals im Klartext zugänglich sein. Ein sicherer Ansatz umfasst die Nutzung von Secret Vaults, die Vergabe kurzlebiger Berechtigungen („Just-in-time“) sowie die kontinuierliche Erkennung möglicher Lecks, etwa durch die Analyse von Modellantworten. Selbst scheinbar harmlose Ausgaben können sensible Datenfragmente enthalten, wenn das System nicht korrekt gestaltet ist.

Schließlich ist die Nachverfolgung entscheidend, wer — oder was — eine Aktion ausgeführt hat. KI-Agenten sollten eigene Identitäten und klar definierte Berechtigungen besitzen, anstatt unter gemeinsamen Konten zu arbeiten. Jeder Schritt, vom Input über die Entscheidung bis zur Aktion, muss in einer durchgängigen Audit-Logik erfasst werden. Dieses End-to-End-Tracking ermöglicht nicht nur die Analyse von Vorfällen, sondern stärkt auch das Vertrauen in Systeme, die sonst als intransparent wahrgenommen werden könnten.

Der Übergang von klassischer Zugriffskontrolle zu einer sicherheitsorientierten Betrachtung von Absichten stellt einen grundlegenden Paradigmenwechsel dar. Es reicht nicht mehr aus zu fragen, ob ein System berechtigt ist zu handeln, sondern ob sein Handeln im Einklang mit den Zielen und Richtlinien der Organisation steht. Auditierbarkeit ist kein nachträglicher Zusatz, sondern ein zentrales Designprinzip. Organisationen, die diesen Ansatz verfolgen, erreichen nicht nur ein höheres Sicherheitsniveau, sondern können KI auch mit Vertrauen skalieren. Ohne dieses Fundament stößt jede weitere Automatisierung auf dieselbe Hürde: die Unsicherheit, ob das System die richtigen Dinge auf die richtige Weise tut — und ob sich dies im Nachhinein belegen lässt.