Abstract
Die Befragung zur Studie fand im Dezember 2003 über das Internet statt.
Experten im deutschsprachigen Raum wurden gezielt angeschieben, um
anhand von 34 Fragen den künftigen Bedarf an Sprachressourcen (in den
nächsten 5 bis 15 Jahren) und technische (Folge-)Entwicklungen zu
ermitteln. 37 Experten haben auf die Fragen geantwortet, sechs davon
haben die Studie nicht zu Ende geführt. Ihre Meinung ist trotzdem in
die Wertung eingegangen. Die Zahlen in Klammern zeigen im Text an, wie
viele Experten jeweils der gleichen Meinung waren. Am Ende der Studie
steht eine Übersicht, wie viele Teilnehmer insgesamt auf die jeweilige
Frage geantwortet haben.
Die Hauptthemen sind in fünf Kapitel untergliedert.
Hauptaspekte der Studie auf einen Blick
Teil I: Künftige Sprachressourcen
Künftig werden besonders Sprachressourcen mit Fehlern in der
Spontansprache (30), Datenbanken mit Sprechern aller Alterskategorien
(Generationenkorpora) (23), Ressourcen mit gemischt-sprachlichen Daten
(z.B. Deutsch mit englischen Fremdwörtern) (18) und
Zweitsprachressourcen (d.h. mit Nicht-Muttersprachlern Deutsch) (18)
gebraucht werden. Für das Erfassen von Dialekten empfehlen Experten,
nur dialektal-gefärbte Hochsprache in einer lediglich repräsentativen
Menge innerhalb einer Sprachressource aufzunehmen und für die
Dialektabdeckung dynamisch zuschaltbare Ressourcen zu verwenden.
Teil II: Organisation der Zusammenarbeit zwischen Sprachtechnologie-Institutionen
Eine erhöhte Zusammenarbeit zwischen Institutionen ist erwünscht.
Selbst wenn in Zukunft noch mehr Ressourcen in Zusammenarbeit zwischen
Institutionen geschaffen werden, wird doch die anschließend
individuelle Produktentwicklung aus Wettbewerbsgründen bestehen bleiben.
Teil III: Organisation der Erfassung und Distribution von Ressourcen
Integrierte Ressourcen sollen Informationen zur Gestik, Mimik und
Emotion des Benutzers erfassen und die gelabelten Daten bereitstellen.
Teil IV: Technische Sprachanwendungen der Zukunft
Die technischen Sprachanwendungen der Zukunft werden
Sprachdialogsysteme zwischen Mensch und Maschine und der Bereich
Information Management sein. Im Bereich militärischer Anwendungen
werden die Überwachung, Übersetzung, Auswertung und Vermittlung von
gesprochenem (und geschriebenem) Inhalt zur Verbesserung strategischen
Vorgehens im Konfliktfall am wichtigsten sein.
Teil V: Grundlagenforschung
Die Grundlagenforschung soll u.a. die Sicherung seltener und bedrohter
Sprachen übernehmen und nicht nur rein anwendungsorientiert handeln.
Jedoch wird die Anwendungsorientiertheit als ein zentraler Aspekt
innerhalb der Grundlagenforschung genannt, damit die
Grundlagenforschung sich nicht im rein Theoretischen verzettelt. Die
Forschung wird sich in den nächsten Jahren vor allem auf die Planung
langfristiger Korpora konzentrieren und sich weiter mit der
Sprachentwicklung des Menschen beschäftigen.
Zusammenfassung der Gesamtergebnisse aus der Studie
Teil I: Künftige Sprachressourcen
Der Bedarf an Korpora mit aufgezeichneten Fehlern
in der Spontansprache wird mit 30 übereinstimmenden Meinungen deutlich als
besonders hoch eingestuft. Korpora mit Sprechern aus unterschiedlichen
Generationen werden nach Meinung von 23 Experten einen steigenden Absatz finden
und jeweils 18 Stimmen sehen in gemischt-sprachlichen Ressourcen und
Zweitsprachressourcen einen großen Bedarf. Zu den beiden Letzteren gibt es den
Einwand, dass bei regelmäßigen Updates der Lexikoneinträge keine zusätzlichen
Datenbanken mehr angelegt werden müssten, da Veränderungen in der
Sprachentwicklung dadurch automatisch erfasst würden.
Weniger eindeutige Ergebnisse sind für die Erfassung von Emotion und Biometrie zu
verzeichnen. 21 Experten halten die Beschäftigung mit der emotionalen
Komponente von Sprache für wichtig. Jedoch sehen einige ein Problem in der
Erfassung und objektiven Weiterverarbeitung bei der Annotation. Andere halten
dieses Thema schlicht für überbewertet.
Die Biometrie wird nur bedingt als
zukunftsträchtig angesehen. 17 Befragte halten den Bedarf zwar für hoch, jedoch
einige nur unter der Bedingung, dass bei sicherheitskritischen Anwendungen
Robustheit und Zugangssicherheit gewährleistet sind. Dies ist aber momentan nur
in Kombination mit anderen Modalitäten und Verfahren möglich.
Dialekte sollen im Anwendungsbereich nur auf dialektal-gefärbte Hochsprache beschränkt aufgezeichnet werden.
Innerhalb einer Sprachressource sollte der Dialekt nur repräsentativ abgedeckt
werden und nicht im Fokus stehen. Werden separate Dialektdatenbanken angelegt,
können sie dynamisch in eine Anwendung geschaltet werden.
Beim Erheben von Kindersprachdaten sollen Kinder verschiedener Alterstufen
aufgezeichnet werden. Die Experten nehmen dabei eine Unterteilung in bis zu 7
Stufen vor. Für den Zweck der Spracherwerbsforschung wird empfohlen, mit ersten
Untersuchungen spätestens ab dem 9. Monat nach der Geburt zu beginnen. Für Computer-Anwendungen ist das 5. Lebensjahr
als Beginn ausreichend. Als Anwendungsszenarien wurden auch Freizeit,
Medizin, Forschung und das Lehren und Lernen (21) von Sprache genannt. Die
geforderten Sprachinhalte sind sehr verschieden, sie werden im Detail im Text
aufgeführt.
Teil II: Organisation der Zusammenarbeit zwischen Sprachtechnologie-Institutionen
Eine stärkere Zusammenarbeit zwischen Institutionen wird von allen Befragten gewünscht, da
die gesamte Infrastruktur der Sprachtechnologie dadurch gestärkt und die
Qualität der Ressourcen zunehmen wird. Das Modell der gemeinsamen
Ressourcen-Schaffung und individuellen Produktentwicklung wird dabei auch in
Zukunft aus Wettbewerbsgründen der Standard bleiben.
Forschungseinrichtungen sollen gegenüber Firmen weiterhin bevorzugt
werden, indem sie von der Lizenzgebühr auf Ressourcen befreit
werden, sofern mit der Ressource Forschung betrieben wird. Wurden
Ressourcen aus öffentlicher Hand finanziert, sollen sie der
Allgemeinheit dienen und daher auch allgemein zugänglich sein. Die
Förderung für die Schaffung von Sprachdatenbanken
soll sowohl aus staatlichen als auch aus privatwirtschaftlichen Quellen
kommen,
wobei nur der Staat im Gegensatz zu Firmen dazu bereit sein wird, zu
Forschungszwecken auch
wirtschaftlich uninteressante Ressourcen zu unterstützen. Kosten für
die
Schaffung von Ressourcen können durch den Vertrieb nur zum Teil
ausgeglichen werden.
Juristisch müssen vor einer
Aufnahme der Schutz des Sprechers garantiert und andere Sicherheitsregelungen
schriftlich festgehalten werden.
Die allgemeine Nachfrage im Bereich der mobilen Dienste, der Wunsch nach Förderung des Zusammenwachsens
Europas und die Verbesserung der Sensor- und Computertechnik wirken sich in der
Entwicklung der Sprachtechnologie sicherlich förderlich aus, die momentane
wirtschaftliche Lage Deutschlands und unausgereifte Systeme auf dem Markt
hemmen dagegen die Nachfrage.
Teil III: Organisation der Erfassung und Distribution von Sprachressourcen
Integrierte Ressourcen sollen Gestik, Mimik und die Emotion des Benutzers erfassen und deren Labelung
beinhalten. Außerdem sollen immer genaue Metadaten zu den Sprechern vorhanden sein und das
Szenario im Detail beschrieben werden.
Sowohl die Qualität von Aufnahmen über
das Telefon/Handy als auch Studio-Aufnahmen haben ihre eigene Berechtigung. Studioaufnahmen
sind besser für die Sprachsynthese geeignet und ermöglichen gleichzeitig eine
synthetische Simulation der Telefonqualität.
Bei den Aussprachemodellen gehen die expliziten Ausspracheregeln (Lexika) und die statistischen Modelle
Hand in Hand und sollten miteinander kombiniert werden, um die Vorteile beider
Verfahren am besten nutzen zu können.
Teil IV: Technische Sprachanwendungen der Zukunft
Sprachdialogsysteme zwischen Mensch und Maschine und Innovationen im
Bereich des Information Management werden vor allen anderen Bereichen
wohl die technischen Sprachanwendungen der Zukunft sein.
Im Bereich der medizinischen Anwendungen im speziellen stehen Therapie-
und Trainings-Anwendungen und die unterstützende künstliche Stimme zum
Selbstausdruck bei Sprech- und Sprachbehinderungen an erster Stelle.
Die Biometrie wird zukünftig weiterhin auf die Personalisierung
beschränkt bleiben und nicht für die Fahrerzustandserkennung eingesetzt
werden.
Sprachtechnologie im militärischen Bereich wird hauptsächlich für die
Überwachung, Übersetzung, Auswertung und Übermittlung gesprochenen
(Nachrichten), aber auch geschriebenen Inhalts eingesetzt werden, um
das strategische Vorgehen im Konfliktfall zu verbessern.
In Zukunft werden sowohl Neugenerierungen als auch Modifikationen von
bestehenden Produkten vorgenommen werden. Eine Entscheidung für das
eine oder andere hängt individuell von schon bestehenden Produkten und
den genauen Bedürfnissen der Anwender ab. Ob Produkte wie z.B.
Dialogsysteme neu generiert oder modifiziert werden, wird von der
Akzeptanz des Kunden abhängen.
Teil V: Grundlagenforschung
Die Schaffung von neuen Korpora soll auch die Sicherung von seltenen
und bedrohten Sprachen umfassen und nicht nur von einer rein
anwendungsorientierten Sichtweise ausgehen. Laut Umfrage ist die
'Anwendungsorientiertheit' aber ein wichtiger Bereich, auf den sich die
GF stützen sollte. Seltene Sprachen können durchaus auch einen
'Marktwert' haben.
Schützenswert sind im
außereuropäischen Raum vor allem die kleinen Sprachgruppen
der früheren UdSSR, afrikanische und indianische bzw.
südamerikanische Sprachen; im europäischen Raum deutsche
Dialekte und Zigeunersprachen (nach Häufigkeit ihrer
Nennung).
Korpora werden demnächst bestimmte Charakteristika haben:
Natürlichkeit, Multimodalität, Multilingualität und
Portabilität. Vor allem werden auch einfach verfügbare
Datenströme wie TV und Radio für Korpora verwendet werden.
Für die Erstellung von Korpora sollen übergeordnete Stellen eingerichtet und
gemeinschaftliche, institutions-übergreifende Anträge üblich werden. Die
Forschungsplanung wird vor allem an der
Erstellung langfristiger Korpora ausgerichtet sein und die Vereinheitlichung von Standards voranbringen.
Die Erforschung der
Sprachentwicklung des Menschen wird ein wichtiges Feld bleiben.
Verantwortliches Organ für das Betreiben von GF soll auf
nationaler Ebene der Staat sein (in Form von BMBF und DFG),
auf internationaler Ebene die EU in Form spezieller Initiativen.
Staatliche Institutionen sollten dabei besonders die Evaluationen
kontrollieren und für die finanziellen Mittel sorgen,
Universitäten und andere Forschungseinichtungen hingegen sollen
für
die Ausführung zuständig sein. Die Industrie wird langfristig
als Geldgeber unabdingbar sein, was gleichzeitig ihr
Mitspracherecht bedeuten wird.