KI-Tools sind in vielen Bereichen sehr hilfreich. Sie erleichtern Recherche, Textarbeit oder Transkription enorm. Problematisch wird es jedoch, wenn sensible Daten dabei über Cloud-Dienste laufen und/oder in Nicht-EU-Staaten übertragen werden. Insbesondere bei Interviews, Zeitzeugengesprächen oder vertraulichen Forschungsdaten ist der Datenschutz entscheidend. Genau hier setzt noScribe an: ein Tool, das Audio- oder Videomaterial lokal auf dem eigenen Rechner transkribiert, ohne dass dabei Daten an Dritte übermittelt werden.
no was?
noScribe ist ein Open-Source-Projekt von Kai Dröge, das Audio- und Videodateien mithilfe Künstlicher Intelligenz (KI) transkribiert. Das ist für sich genommen nichts besonderers. Aber anders als andere Tools arbeitet noScribe komplett offline. Die Software greift dafür unter anderem auf Whisper von OpenAI zurück, das Sprache zuverlässig in Text umwandelt. Dabei erkennt das Tool auch unterschiedliche Sprecher und verfügt über einen Editor, mit dem sich Transkripte direkt prüfen und korrigieren lassen.
Das Besondere: Alles läuft lokal. Keine Verbindung zu externen Servern, keine Speicherung in der Cloud – die Daten bleiben auf dem eigenen Computer. Damit ist noScribe eine datenschutzfreundliche Alternative zu Cloud-Diensten wie zum Beispiel Otter.ai oder google PinPoint, das ich hier vorgestellt habe..
Datenschutz ist richtig und wichtig
In größeren Unternehmen und Institutionen bereitet die zunehmende Verbreitung und Nutzung von KI-Assistenten auf fremden Servern den Datenschutzabteilungen große Kopfschmerzen. Denn die Tools sind zwar oft sehr hilfreich, aber damit sie überhaupt arbeiten können, müssen Daten auf fremden Servern übertragen werden. Wer aber personenbezogene oder vertrauliche Inhalte verarbeitet, muss genau prüfen, ob das zulässig ist. Meist wird das eher schwierig sein. Eine Lösung für dieses Problem bieten lokal ausgeführte KI-Lösungen, wie sie auch die Datenschutz-Expert*innen von datenschutz-notizen.de empfehlen.
Die Installation von noScribe
Du kannst Dir noScribe kostenlos bei GitHub herunterladen. Zur Auswahl stehen Installationspakete für Linux, Windows und MacOS. Insgesamt brauchst Du etwa 3,5 Gigabyte freien Speicher für das Tool. Ist es installiert, startest Du es per Klick auf das Programmicon. Die Oberfläche ist übersichtlich gestaltet, sodass sich die Bedienung schnell erschließt.
Ist die Transkription zu gebrauchen?
Tatsächlich bin ich mit dem Ergebnis sehr zufrieden. Für den Test habe ich einen Podcast mit drei Sprechern und einer Länge von 20 Minuten transkribieren lassen. Dafür hat noScribe etwa fünf Minuten gebraucht. Auf älteren oder schwächeren Geräten kann die Transkription aber länger dauern. Ist die Umwandlung von Sprache in Text fertig, öffnet sich automatisch ein Editor, in dem Du noch Korrekturen vornehmen kannst. Tatsächlich war das aber kaum nötig. Ich kann noScribe daher nur empfehlen: Wer Audio- oder Videomaterial transkribieren möchte, ohne Daten aus der Hand zu geben, findet hier eine großartige Lösung, die dazu noch kostenlos ist.
Download und weitere Informationen
Weitere Informationen, Installationshinweise und den Download gibt es auf GitHub Eine ausführliche Einführung in das Tool bietet außerdem die Bundesstiftung Aufarbeitung und die Expert*innen von datenschutz-notizen.de haben das Tool nicht nur in Bezug auf den Datenschutz ausgiebig getestet.