Abstract

Die Befragung zur Studie fand im Dezember 2003 über das Internet statt. Experten im deutschsprachigen Raum wurden gezielt angeschieben, um anhand von 34 Fragen den künftigen Bedarf an Sprachressourcen (in den nächsten 5 bis 15 Jahren) und technische (Folge-)Entwicklungen zu ermitteln. 37 Experten haben auf die Fragen geantwortet, sechs davon haben die Studie nicht zu Ende geführt. Ihre Meinung ist trotzdem in die Wertung eingegangen. Die Zahlen in Klammern zeigen im Text an, wie viele Experten jeweils der gleichen Meinung waren. Am Ende der Studie steht eine Übersicht, wie viele Teilnehmer insgesamt auf die jeweilige Frage geantwortet haben.
Die Hauptthemen sind in fünf Kapitel untergliedert.

Hauptaspekte der Studie auf einen Blick

Teil I: Künftige Sprachressourcen
Künftig werden besonders Sprachressourcen mit Fehlern in der Spontansprache (30), Datenbanken mit Sprechern aller Alterskategorien (Generationenkorpora) (23), Ressourcen mit gemischt-sprachlichen Daten (z.B. Deutsch mit englischen Fremdwörtern) (18) und Zweitsprachressourcen (d.h. mit Nicht-Muttersprachlern Deutsch) (18) gebraucht werden. Für das Erfassen von Dialekten empfehlen Experten, nur dialektal-gefärbte Hochsprache in einer lediglich repräsentativen Menge innerhalb einer Sprachressource aufzunehmen und für die Dialektabdeckung dynamisch zuschaltbare Ressourcen zu verwenden.

Teil II: Organisation der Zusammenarbeit zwischen Sprachtechnologie-Institutionen
Eine erhöhte Zusammenarbeit zwischen Institutionen ist erwünscht. Selbst wenn in Zukunft noch mehr Ressourcen in Zusammenarbeit zwischen Institutionen geschaffen werden, wird doch die anschließend individuelle Produktentwicklung aus Wettbewerbsgründen bestehen bleiben.

Teil III: Organisation der Erfassung und Distribution von Ressourcen
Integrierte Ressourcen sollen Informationen zur Gestik, Mimik und Emotion des Benutzers erfassen und die gelabelten Daten bereitstellen.

Teil IV: Technische Sprachanwendungen der Zukunft
Die technischen Sprachanwendungen der Zukunft werden Sprachdialogsysteme zwischen Mensch und Maschine und der Bereich Information Management sein. Im Bereich militärischer Anwendungen werden die Überwachung, Übersetzung, Auswertung und Vermittlung von gesprochenem (und geschriebenem) Inhalt zur Verbesserung strategischen Vorgehens im Konfliktfall am wichtigsten sein.

Teil V: Grundlagenforschung
Die Grundlagenforschung soll u.a. die Sicherung seltener und bedrohter Sprachen übernehmen und nicht nur rein anwendungsorientiert handeln. Jedoch wird die Anwendungsorientiertheit als ein zentraler Aspekt innerhalb der Grundlagenforschung genannt, damit die Grundlagenforschung sich nicht im rein Theoretischen verzettelt. Die Forschung wird sich in den nächsten Jahren vor allem auf die Planung langfristiger Korpora konzentrieren und sich weiter mit der Sprachentwicklung des Menschen beschäftigen.

Zusammenfassung der Gesamtergebnisse aus der Studie

Teil I: Künftige Sprachressourcen

Der Bedarf an Korpora mit aufgezeichneten Fehlern in der Spontansprache wird mit 30 übereinstimmenden Meinungen deutlich als besonders hoch eingestuft. Korpora mit Sprechern aus unterschiedlichen Generationen werden nach Meinung von 23 Experten einen steigenden Absatz finden und jeweils 18 Stimmen sehen in gemischt-sprachlichen Ressourcen und Zweitsprachressourcen einen großen Bedarf. Zu den beiden Letzteren gibt es den Einwand, dass bei regelmäßigen Updates der Lexikoneinträge keine zusätzlichen Datenbanken mehr angelegt werden müssten, da Veränderungen in der Sprachentwicklung dadurch automatisch erfasst würden.

Weniger eindeutige Ergebnisse sind für die Erfassung von Emotion und Biometrie zu verzeichnen. 21 Experten halten die Beschäftigung mit der emotionalen Komponente von Sprache für wichtig. Jedoch sehen einige ein Problem in der Erfassung und objektiven Weiterverarbeitung bei der Annotation. Andere halten dieses Thema schlicht für überbewertet.
Die Biometrie wird nur bedingt als zukunftsträchtig angesehen. 17 Befragte halten den Bedarf zwar für hoch, jedoch einige nur unter der Bedingung, dass bei sicherheitskritischen Anwendungen Robustheit und Zugangssicherheit gewährleistet sind. Dies ist aber momentan nur in Kombination mit anderen Modalitäten und Verfahren möglich.

Dialekte sollen im Anwendungsbereich nur auf dialektal-gefärbte Hochsprache beschränkt aufgezeichnet werden. Innerhalb einer Sprachressource sollte der Dialekt nur repräsentativ abgedeckt werden und nicht im Fokus stehen. Werden separate Dialektdatenbanken angelegt, können sie dynamisch in eine Anwendung geschaltet werden.

Beim Erheben von Kindersprachdaten sollen Kinder verschiedener Alterstufen aufgezeichnet werden. Die Experten nehmen dabei eine Unterteilung in bis zu 7 Stufen vor. Für den Zweck der Spracherwerbsforschung wird empfohlen, mit ersten Untersuchungen spätestens ab dem 9. Monat nach der Geburt zu beginnen. Für Computer-Anwendungen ist das 5. Lebensjahr als Beginn ausreichend. Als Anwendungsszenarien wurden auch Freizeit, Medizin, Forschung und das Lehren und Lernen (21) von Sprache genannt. Die geforderten Sprachinhalte sind sehr verschieden, sie werden im Detail im Text aufgeführt.

Teil II: Organisation der Zusammenarbeit zwischen Sprachtechnologie-Institutionen

Eine stärkere Zusammenarbeit zwischen Institutionen wird von allen Befragten gewünscht, da die gesamte Infrastruktur der Sprachtechnologie dadurch gestärkt und die Qualität der Ressourcen zunehmen wird. Das Modell der gemeinsamen Ressourcen-Schaffung und individuellen Produktentwicklung wird dabei auch in Zukunft aus Wettbewerbsgründen der Standard bleiben.

Forschungseinrichtungen sollen gegenüber Firmen weiterhin bevorzugt werden, indem sie von der Lizenzgebühr auf Ressourcen befreit werden, sofern mit der Ressource Forschung betrieben wird. Wurden Ressourcen aus öffentlicher Hand finanziert, sollen sie der Allgemeinheit dienen und daher auch allgemein zugänglich sein. Die Förderung für die Schaffung von Sprachdatenbanken soll sowohl aus staatlichen als auch aus privatwirtschaftlichen Quellen kommen, wobei nur der Staat im Gegensatz zu Firmen dazu bereit sein wird, zu Forschungszwecken auch wirtschaftlich uninteressante Ressourcen zu unterstützen. Kosten für die Schaffung von Ressourcen können durch den Vertrieb nur zum Teil ausgeglichen werden.

Juristisch müssen vor einer Aufnahme der Schutz des Sprechers garantiert und andere Sicherheitsregelungen schriftlich festgehalten werden.

Die allgemeine Nachfrage im Bereich der mobilen Dienste, der Wunsch nach Förderung des Zusammenwachsens Europas und die Verbesserung der Sensor- und Computertechnik wirken sich in der Entwicklung der Sprachtechnologie sicherlich förderlich aus, die momentane wirtschaftliche Lage Deutschlands und unausgereifte Systeme auf dem Markt hemmen dagegen die Nachfrage.

Teil III: Organisation der Erfassung und Distribution von Sprachressourcen

Integrierte Ressourcen sollen Gestik, Mimik und die Emotion des Benutzers erfassen und deren Labelung beinhalten. Außerdem sollen immer genaue Metadaten zu den Sprechern vorhanden sein und das Szenario im Detail beschrieben werden.

Sowohl die Qualität von Aufnahmen über das Telefon/Handy als auch Studio-Aufnahmen haben ihre eigene Berechtigung. Studioaufnahmen sind besser für die Sprachsynthese geeignet und ermöglichen gleichzeitig eine synthetische Simulation der Telefonqualität.

Bei den Aussprachemodellen gehen die expliziten Ausspracheregeln (Lexika) und die statistischen Modelle Hand in Hand und sollten miteinander kombiniert werden, um die Vorteile beider Verfahren am besten nutzen zu können.

Teil IV: Technische Sprachanwendungen der Zukunft

Sprachdialogsysteme zwischen Mensch und Maschine und Innovationen im Bereich des Information Management werden vor allen anderen Bereichen wohl die technischen Sprachanwendungen der Zukunft sein.

Im Bereich der medizinischen Anwendungen im speziellen stehen Therapie- und Trainings-Anwendungen und die unterstützende künstliche Stimme zum Selbstausdruck bei Sprech- und Sprachbehinderungen an erster Stelle.

Die Biometrie wird zukünftig weiterhin auf die Personalisierung beschränkt bleiben und nicht für die Fahrerzustandserkennung eingesetzt werden.

Sprachtechnologie im militärischen Bereich wird hauptsächlich für die Überwachung, Übersetzung, Auswertung und Übermittlung gesprochenen (Nachrichten), aber auch geschriebenen Inhalts eingesetzt werden, um das strategische Vorgehen im Konfliktfall zu verbessern.

In Zukunft werden sowohl Neugenerierungen als auch Modifikationen von bestehenden Produkten vorgenommen werden. Eine Entscheidung für das eine oder andere hängt individuell von schon bestehenden Produkten und den genauen Bedürfnissen der Anwender ab. Ob Produkte wie z.B. Dialogsysteme neu generiert oder modifiziert werden, wird von der Akzeptanz des Kunden abhängen.

Teil V: Grundlagenforschung

Die Schaffung von neuen Korpora soll auch die Sicherung von seltenen und bedrohten Sprachen umfassen und nicht nur von einer rein anwendungsorientierten Sichtweise ausgehen. Laut Umfrage ist die 'Anwendungsorientiertheit' aber ein wichtiger Bereich, auf den sich die GF stützen sollte. Seltene Sprachen können durchaus auch einen 'Marktwert' haben.

Schützenswert sind im außereuropäischen Raum vor allem die kleinen Sprachgruppen der früheren UdSSR, afrikanische und indianische bzw. südamerikanische Sprachen; im europäischen Raum deutsche Dialekte und Zigeunersprachen (nach Häufigkeit ihrer Nennung).

Korpora werden demnächst bestimmte Charakteristika haben:  Natürlichkeit, Multimodalität, Multilingualität und Portabilität. Vor allem werden auch einfach verfügbare Datenströme wie TV und Radio für Korpora verwendet werden.

Für die Erstellung von Korpora sollen übergeordnete Stellen eingerichtet und gemeinschaftliche, institutions-übergreifende Anträge üblich werden. Die Forschungsplanung wird vor allem an der Erstellung langfristiger Korpora ausgerichtet sein und die Vereinheitlichung von Standards voranbringen.

Die Erforschung der Sprachentwicklung des Menschen wird ein wichtiges Feld bleiben.

Verantwortliches Organ für das Betreiben von GF soll auf nationaler Ebene der Staat sein (in Form von BMBF und DFG), auf internationaler Ebene die EU in Form spezieller Initiativen. Staatliche Institutionen sollten dabei besonders die Evaluationen kontrollieren und für die finanziellen Mittel sorgen, Universitäten und andere Forschungseinichtungen hingegen sollen für die Ausführung zuständig sein. Die Industrie wird langfristig als Geldgeber unabdingbar sein, was gleichzeitig ihr Mitspracherecht bedeuten wird.