Zurück zur Übersicht
06.05.2026

Rechtsgrundlage bei Transkription

Immer mehr Unternehmen nutzen KI-gestützte Tools, um Videokonferenzen automatisch zu protokollieren. Was praktisch ist, wirft datenschutzrechtliche Fragen auf: Auf welche Rechtsgrundlage lässt sich die Transkription stützen? Und macht es einen Unterschied, ob in Echtzeit transkribiert oder eine Aufzeichnung nachträglich umgewandelt wird? Das Bayerische Landesamt für Datenschutzaufsicht (BayLDA) hat auf der Sitzung des GDD-ERFA-Kreises München am 20. März 2026 klare Antworten gegeben.

Bei der Transkription von Videokonferenzen kommen grundsätzlich zwei Rechtsgrundlagen in Betracht: die Einwilligung nach Art. 6 Abs. 1 Buchst. a DS-GVO und die berechtigten Interessen nach Art. 6 Abs. 1 Buchst. f DS-GVO.

Die Einwilligung steht im Beschäftigungskontext vor einem strukturellen Problem. Nach § 26 Abs. 2 Satz 1 BDSG muss bei der Beurteilung der Freiwilligkeit die Abhängigkeit der beschäftigten Person berücksichtigt werden. Da Mitarbeitende oft keine echte Wahlfreiheit haben und berufliche Nachteile befürchten könnten, ist die Freiwilligkeit im Beschäftigungsverhältnis regelmäßig kritisch zu bewerten.

Sobald Beschäftigte an der Konferenz teilnehmen, kommt daher in der Regel nur Art. 6 Abs. 1 Buchst. f DS-GVO als Rechtsgrundlage in Betracht. Nicht jede Transkription ist damit automatisch zulässig. Das BayLDA betont, dass für jede Videokonferenz einzeln zu prüfen ist, ob ein berechtigtes Interesse vorliegt, ob die Verarbeitung erforderlich ist und ob die Interessen der Betroffenen überwiegen. Vor der Teilnahme sind die betroffenen Personen über die berechtigten Interessen und ihr Widerspruchsrecht nach Art. 21 DS-GVO zu informieren.

Nehmen ausschließlich externe Dienstleister teil, kann auch eine Einwilligung nach Art. 6 Abs. 1 Buchst. a DS-GVO in Betracht gezogen werden. Allerdings macht die jederzeitige Widerrufsmöglichkeit nach Art. 7 Abs. 3 DS-GVO die Einwilligung auch hier aus Sicht des Verantwortlichen in der Regel ungeeignet.

Echtzeit-Transkription oder nachträgliche Aufzeichnung: Macht das einen Unterschied?

Technisch gesehen wird in beiden Fällen das gesprochene Wort zunächst aufgezeichnet und dann transkribiert. Auch bei einer unmittelbaren Transkription findet also eine kurzzeitige Aufzeichnung statt. Der Unterschied liegt jedoch in der datenschutzrechtlichen Bewertung im Hinblick auf Erforderlichkeit, Interessenabwägung und den Grundsatz der Datenminimierung nach Art. 5 Abs. 1 Buchst. c DS-GVO.

Eine Audioaufzeichnung enthält deutlich mehr sensible Daten als ein Transkript. Sie speichert nicht nur den Inhalt des Gesagten, sondern auch die Stimme der Person und damit unter Umständen Emotionen oder gesundheitliche Hinweise. Diese Informationen fehlen in einem reinen Textprotokoll. Eine zeitnahe Transkription, verbunden mit einer ebenso zeitnahen Löschung der Aufzeichnung, stellt daher eine erheblich weniger eingreifende Datenverarbeitung dar. Das BayLDA empfiehlt, diesen Weg zu bevorzugen, soweit dies technisch möglich ist.

Unsere Empfehlungen

Unternehmen und KMU

Prüfen Sie vor dem Einsatz von Transkriptions-Tools, ob Beschäftigte an den betreffenden Konferenzen teilnehmen. Wenn ja, stützen Sie die Transkription auf Art. 6 Abs. 1 Buchst. f DS-GVO und führen Sie die Interessenabwägung schriftlich durch. Informieren Sie alle Teilnehmenden vorab über Zweck, Rechtsgrundlage und Widerspruchsrecht. Wählen Sie, wenn möglich, eine Lösung, die in Echtzeit transkribiert und die Aufzeichnung unmittelbar nach der Transkription löscht. Halten Sie den Prozess im Verzeichnis der Verarbeitungstätigkeiten fest.

Behörden und öffentliche Stellen

Für öffentliche Stellen in Bayern gilt zusätzlich das Bayerische Datenschutzgesetz. Die Grundstruktur der Prüfung bleibt jedoch identisch: Rechtsgrundlage bestimmen, Erforderlichkeit prüfen, Betroffene informieren. Externe Dienstleister, die an transkribierten Besprechungen teilnehmen, sind gesondert zu betrachten. Schließen Sie in diesen Fällen gegebenenfalls einen Auftragsverarbeitungsvertrag nach Art. 28 DS-GVO ab.

Gesundheitseinrichtungen

In Besprechungen, bei denen über Patientinnen und Patienten gesprochen wird, können besondere Kategorien personenbezogener Daten nach Art. 9 DS-GVO erfasst werden. Prüfen Sie in diesen Fällen besonders sorgfältig, ob eine Transkription überhaupt erforderlich ist. Lassen Sie Transkriptions-Tools niemals ohne vorangehende Datenschutz-Folgenabschätzung nach Art. 35 DS-GVO einführen.

Kanzleien und Freiberufler

Mandantengespräche per Videokonferenz unterliegen der anwaltlichen Verschwiegenheit. Eine Transkription dieser Gespräche ist datenschutz- und berufsrechtlich besonders heikel. Prüfen Sie, ob das eingesetzte Tool Daten an Server ausserhalb der EU überträgt, und klären Sie die Frage der Auftragsverarbeitung mit dem Anbieter. Holen Sie im Zweifel eine gesonderte Einwilligung der Mandantschaft ein und dokumentieren Sie diese sorgfältig.

Quelle: Bayerisches Landesamt für Datenschutzaufsicht

Lassen Sie sich unverbindlich von einem Datenschutzbeauftragten beraten.

Kontakt aufnehmen

Weitere unterstützende Hinweise zum Datenschutz finden Sie in diesen Beiträgen:

Dieser Absatz enthält Affiliatelinks/Werbelinks