Minuten statt Stunden: So erstellt der Landtag Mecklenburg-Vorpommern Protokolle mit Tucan.ai.
Wer jemals auf der Besuchertribüne einer Landtagssitzung Platz genommen hat, weiß: Debatten können rasant, hitzig und von regionalen Dialekten geprägt sein. Was in Echtzeit gesagt wird, wird später Teil des offiziellen Protokolls – eine Pflichtaufgabe, die in Schwerin bis vor kurzem große Teile der Verwaltung band. Für jede Stunde Redezeit mussten Schreibkräfte sechs bis zwölf Stunden mit Tippen, Korrigieren und Formatieren verbringen. Live-Untertitel für Menschen mit Hörbeeinträchtigung? Mangelhaft – der bisherige Anbieter sorgte immer wieder für technische Probleme.
Auf der Suche nach einer Alternative stieß die Parlamentsverwaltung im Jahr 2022 auf Tucan.ai, ein Berliner Start-up, das auf KI-gestützte Spracherkennung „Made in Germany“ spezialisiert ist. Im Gegensatz zu vielen amerikanischen Lösungen verspricht Tucan.ai eine DSGVO-konforme Verarbeitung in deutschen Rechenzentren und eine Genauigkeitsrate, die auch vor Dialekten und Zwischenrufen nicht zurückweicht. Doch halten die Versprechen der parlamentarischen Realität stand?
Der erste Test verlief unspektakulär, aber vielversprechend. Die IT-Abteilung schickte eine zehnminütige Audioaufnahme an das Start-up. Nach vier Minuten lag ein Rohtranskript vor, in dem über 90 Prozent der Wörter korrekt erkannt wurden – genug, um den Versuch auf ganze Sitzungstage auszuweiten. Drei Monate lang liefen manuelle und automatische Transkription parallel. In dieser Zeit fütterten Redakteure das System mit Fachvokabular, korrigierten Eigennamen und klärten Zweifelsfälle. Ende 2023 waren die Trefferquoten so stabil, dass das Parlament den Schritt in den Vollbetrieb wagte.
Seitdem reicht ein einziger Audiostream aus dem Plenarsaal aus. Tucan.ai zerlegt das Signal in Segmente, sogenannte „Chunks“, und speichert diese in einer Vektordatenbank. Dieser technische Kniff stellt sicher, dass die KI auch bei abrupten Themenwechseln und hitzigen Zwischenrufen den Überblick behält. Innerhalb von sechs Minuten ist ein Transkript fertig, das das Redaktionsteam über einen optimierten Web-Editor prüft und freigibt. Heute nimmt die Nachbearbeitung nur noch etwa ein Fünftel der früheren Zeit in Anspruch. Gleichzeitig laufen Live-Untertitel auf den Saalmonitoren und im öffentlichen Stream – ein Gewinn an Barrierefreiheit, der zuvor nur mit erheblichem personellem Aufwand möglich war.
Technisch gesehen bleibt alles auf heimischem Boden. Die Anwendung läuft als Single-Tenant-Instanz in einem Rechenzentrum in Nürnberg; bei Bedarf könnte sie auch komplett On-Premise betrieben werden. Damit erfüllt das Projekt die strengen Datenschutzanforderungen des öffentlichen Dienstes, ohne auf die Flexibilität einer Cloud-Lösung zu verzichten.
Es ist spannend zu beobachten, wie steil die Lernkurve einer solchen KI verläuft. Schon nach zwei Plenartagen waren die Namen der häufigsten Abgeordneten fest im System verankert. Gesetzeszitate, die anfangs noch als Buchstabensalat erschienen, wurden nach wenigen Korrekturen zuverlässig erkannt. Die Erfahrung zeigt: Fehlende Passagen liegen weniger an der Technik als vielmehr an mangelnder Mikrofondisziplin am Pult – eine Erkenntnis, die wohl auch auf andere Parlamente zutrifft.
Und was ist mit der vielzitierten „Halluzination“ großer Sprachmodelle? Wo es um die wörtliche Wiedergabe geht, geht Tucan.ai auf Nummer sicher: Die KI gibt nur das wieder, was im Audio zu hören ist, und markiert Unsicherheiten direkt im Editor. Für künftige Zusatzfunktionen – etwa automatische Zusammenfassungen nach Tagesordnungspunkten – nutzt der Landtag eine zweite Ebene: ein auf Parlamentssprache spezialisiertes Sprachmodell, das seine Aussagen mit Verweisen auf die Originalstelle belegt.
Nach einem halben Jahr im Praxisbetrieb lassen sich die Ergebnisse in vier Sätzen zusammenfassen: Eine Stunde Redezeit landet nach sechs Minuten als Rohtext im System. Die Wortgenauigkeit liegt live bei rund 92 Prozent und nach einer kurzen Korrektur bei 99 Prozent. Das Protokoll wird noch am selben Tag veröffentlicht. Und die Verwaltung spart pro Sitzungsstunde bis zu elf Stunden manuellen Aufwand – Zeit, die künftig in Recherche, Service oder schlicht in einen pünktlichen Feierabend fließt.
Der Blick nach vorn ist bereits skizziert. Noch im Jahr 2024 soll eine Suchfunktion starten, mit der Abgeordnete über tausende Seiten Plenarprotokolle hinweg springen können – inklusive Quelllink zur jeweiligen Rede. So könnte der Landtag Mecklenburg-Vorpommern zeigen, dass die digitale Transformation im Parlament nicht mit großen Versprechen beginnt, sondern mit einem kleinen, messbaren Schritt: das Protokoll schneller fertig zu bekommen. Alles Weitere ergibt sich aus der neu gewonnenen Zeit.