IT & Technik
Schreibe einen Kommentar

Transkriptionssoftware: Dem Himmel sei Dank, dass es sie gibt

Transkriptionssoftware

Medienbrüche sind das Bremspedal optimierter Business-Prozesse. Besonders zeitintensiv: die Verschriftlichung von Sprache. Zum Glück wird Transkriptionssoftware dank Künstlicher Intelligenz immer präziser.

Wochenendarbeit, Termine sehr spät am Abend oder erbarmungslos früh am Morgen, unangenehme Gesprächspartner in Interviews oder solche, die stundenlang auf sich warten lassen.

Manuell transkribieren – braucht kein Mensch

Im journalistischen Berufsalltag gibt es diverse Dinge, die kein Mensch braucht, vor denen Neueinsteiger aber immerhin gewarnt werden. Nur über das wohl ärgste Übel steht nichts im Kleingedruckten: das Transkribieren von Interviews.

Die Faustregel lautet: Eine Stunde Interview braucht in Handarbeit vier Stunden, um vom Audio- in ein Textformat transkribiert zu werden. Ein halber Arbeitstag, nur um das Gesagte fehlerfrei zitieren und im Zweifel nachlesen zu können.

Je komplexer das Thema und je tiefer das Wissen des Interviewten, umso zeitaufwändiger wird der Job. So können aus vier auch schnell mal sechs Stunden werden.

Fummelige Navigation

Es ist nicht nur die Zeit. Es ist dieses immer wieder nervige Zurückziehen auf dem Zeitstrahl, um das Gesagte noch einmal zu hören. Und bei langen Audiodateien ist ein handgesteuerter Rewind um 27 Sekunden in etwa so präzise wie der Versuch mit einer Stecknadel auf einem Globus Bielefeld zu markieren.

Die Journalisten mit dem größten Neidfaktor waren immer die, die sechs Stunden Interview zum „Abtippen“ einfach so auf den Schreibtisch im Sekretariat kippen konnten.

Halbierte Arbeitszeit mit einfacher Spracherkennung

Die ersten Lösungen für Transkriptionssoftware brachten immerhin fast eine Halbierung des Zeitaufwands. Allerdings über einen so hölzernen Umweg, dass der Begriff Medienbruch eine ganz neue Bedeutung bekam: Auf dem Kopfhörer das Interview in kleinen Happen abhören. Pause. Nachsprechen. Zuhören. Pause. Nachsprechen usw. Anschließend wurde die neu entstandene Autodatei mit nur noch einer Sprecherstimme von der Software analysiert und transkribiert.

Solche Lösungen haben z. B. in medizinischen Berufen durchaus ihre Daseinsberechtigung. Denn bei der mündlichen Eingabe eines Befunds gibt es nur eine Stimme und die spricht langsam und deutlich.

Das funktioniert natürlich nur dann, wenn die Software die Stimme vorher kennengelernt hat. Dafür müssen gefühlt Texte von der Länge des Alten Testaments eingesprochen werden. Das Fachvokabular z. B. die Prostatektomie (Entfernung der Prostata) muss der Urologe im Zweifel manuell hinzufügen.

Künstliche Intelligenz zündet den Turbo

Künstliche Intelligenz zündet bei Transkriptionssoftware so etwas wie einen Turbo. Nachsprechen und das Erkennen nur einer Stimme gehören der Vergangenheit an. Audio- und sogar Videodateien werden einfach hochgeladen, die Zahl der Sprecher kann eingegeben werden – den Rest macht die KI.

Minutenschnell und mit erstaunlich guten Genauigkeitsraten. Professionelle Anwendungen schaffen es bis in den Bereich knapp unter 100 Prozent. Eingefügte Timecodes ermöglichen eine komfortable Überprüfung des in ein Wunschformat exportierten Textes. Dieser kann (und muss) im professionellen Bereich immer noch lektoriert werden, doch dafür braucht es nur den Bruchteil der Zeit, die die Ergebnisse herkömmlicher Transkriptionssoftware beanspruchen.

Auswertung der Sprechgeschwindigkeit und Betonung

Das ist besonders bei wissenschaftlichen Anwendungen in der Linguistik relevant, wenn es bei der Auswertung der Audiodateien nicht nur auf die Inhalte ankommt, sondern auch auf Sprechgeschwindigkeit, Pausen und Betonungen.

In der Dialektforschung können über Transkriptionssoftware sogar phonetische Texte ausgegeben werden, um zu dokumentieren und zu analysieren, wie z. B. ein Österreicher und ein Ostfriese miteinander kommunizieren. Im Vergleich dazu ist eine herkömmliche journalistische Transkription doch eher eine überschaubare Aufgabe.

Transkriptionssoftware

Pin it!

Kategorie: IT & Technik

von

Holger Schöttelndreier

Freier Journalist und Autor. Jahrelange Erfahrung in Führungspositionen (Print und Online). U. a. Büroleiter BILD, Chefreporter Hamburger Morgenpost, Ressortleitung und Chefredaktion TV Hören + Sehen, Chefredakteur WOM Magazin, stellv. Chefredakteur Metal Hammer, Objektleiter Wirtschaftsmedien online Heinrich Bauer Verlag.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Wenn Du wissen möchtest, welche Daten wir beim Hinterlassen eines Kommentars speichern, schau bitte in unsere Datenschutzerklärung.