Experten raten sowohl dazu, vom Aussterben bedrohte Dialekte (1) als auch bedrohte eigenständige Sprachen zu sammeln (1). Es gibt unterschiedliche Gründe, weshalb Dialekte oder Sprachen aussterben können: herkömmliche Dialekte werden im Sprachgebrauch z.B. oft durch einen ausgeprägten Prestige-Dialekt ersetzt (1). Eigenständige Sprachen können starken Veränderungen wie z.B. der Zunahme von Anglizismen unterliegen und daher bedroht sein (1). Problematisch ist die Tatsache, dass viele Länder, deren Sprachen nur noch wenige Menschen sprechen, nicht die wissenschaftliche und linguistische Infrastruktur zur Erhaltung der Sprachen besitzen und ohne die Schaffung solcher Datenbanken auch den Anschluss an neue Entwicklungen verpassen werden (1). Zwei Experten würden die Kapazitäten für die Schaffung von Korpora lieber für zukunftsträchtige Anwendungen als für die Sicherung von seltenen Sprachen aufwenden (2).
Russland (7) |
- Sprachen des Kaukasus (2) - Kasachisch (1) - Tscherkessisch (1) - Ossetisch (1) - Weissrussisch (1) - Sprachen der früheren UdSSR (1) |
Afrika (4) |
- Nomadensprachen Nordafrikas (1) - Afrikanische Sprachen (3) |
USA und Südamerika (4) |
- Indianische Sprachen (3) - Südamerikanische Sprachen (1) |
Asien (3) | - Süd-ost-asiatische Sprachen (1) - Indonesische Sprachen (1) - Chinesische Sprachen (1) |
Australien (2) |
- Aboriginessprachen (2) |
Syrien (1) |
- Dialekte in Bergregionen Syriens (1) |
Türkei (1) |
- Sprache der Christen im Südosten der
Türkei (1) |
Naher Osten (1) |
- Kurdisch (1) |
Irak (1) |
- Sprache der irakischen Flüchtlinge in
Europa (1) |
Armenien/Iran/Anatolien (1) |
- Armenisch (1) |
Andere (2) | - Eskimosprachen (1) - Kreolsprachen (1) |
Im europäischen Raum sollten in jedem Fall die Minderheitensprachen, insbesondere die 12 als bedroht eingestuften Sprachen (z.B. Elsässisch, Okzitanisch, Sorbisch), gesichert werden (1).
Deutschland (23) |
- Deutsche Dialekte (9) - Plattdeutsch (3) - Friesisch (4) - Jiddisch (4) (germanische Sprache) - Sorbisch (3) (westslawische Sprache, Minderheitensprache in Deutschland) |
Zigeunersprachen (4) (Albanien, Bulgarien, Türkei, Griechenland, Makedonien, Rumänien, Serbien und Montenegro) |
- Rumänische Roma Variante (1) - Romani (1) - Sinti-Dialekte (1) - andere Zigeunersprachen (1) |
Frankreich (2) (Baskenland, Bretagne) |
- Baskisch (1) - Bretonisch (1) |
Alpentäler der Schweiz/Italien (2) |
- Rätoromanisch (2) (Alpentäler der
Schweiz/Italiens) |
England (1) (Wales) |
- Walisisch (1) |
Belgien (Wallonien)/ Nordosten Frankreichs (1) |
- Wallonisch (1) |
Luxemburg (1) |
- Luxemburgisch (1) (westgermanischer
Kulturdialekt) |
Vier Experten erklären, dass sie keine der Sprachen für wirtschaftlich relevant halten. Meist ist dort, wo es nur wenige Sprecher einer Sprache gibt, aufgrund der kleinen Sprecheranzahl kein großer Markt zu erwarten. Bei einer Sammlung von Sprachdaten geht es hier eher um die Identität der Sprecher (1). Am interessantesten in Bezug auf Marktchancen könnten seltene Sprachen sein, die sehr nahe verwandt sind und viele Varianten besitzen (1). In der Sprachsynthese gäbe es auf jeden Fall Märkte im Hinblick auf das Erlernen solcher Sprachen durch gesprochene Korpora. Allerdings die Überzeugung vorherrschen, dass es sich lohnt, in dieser Sprache zu kommunizieren und das Wissen an künftige Generationen weiterzugeben (1).
Afrika (3) |
- Dialekte Nordafrikas im Übergang zwischen
Arabisch, Berber und Französisch (1) - Südlichere afrikanische Sprachen (1) - Bantu-Sprachen (1) |
Indien (1) |
- Indische Sprachgruppen (1) |
Naher Osten (1) |
- Kurdisch (1) |
China (1) |
- Regionale Varianten des Chinesischen (1) |
Australien (1) |
- Aboriginessprachen (1) |
Deutschland (4) |
- Deutsche Dialekte (1) - Jiddisch (2) - Sorbisch (1) |
Es sollte mehr anwendungsorientierte (Grundlagen-)forschung mit Einbezug der Industrie betrieben werden (4), ohne dass die reine Grundlagenforschung unabhängig von der industriellen Anwendung (z.B. Datensammlung von seltenen Sprachen) (1) dadurch zu sehr ins Hintertreffen gerät (sprich: keine Verlagerung industrieller Forschung in die Hallen der Universitäten) (1). Allgemein sollte die Forschung immer so flexibel bleiben, dass sie sich neuen Entwicklungen anpassen kann (1).
Anwendungsorientierte Grundlagenforschung beschäftigt sich z.B. mit der Frage, wie minimal eine Ressource mindestens sein muss, um mit ihr noch einen guten Spracherkenner bauen zu können (1). Sie sollte immer weitere Ergänzungen zu bisherigen Mitteln der automatisierten Spracherkennung, bezüglich der Erkennungsqualität und auch der "freien Sprache" (statistische Erkennung) liefern (1). Sie konzentriert sich immer auf Sprachen, die von einer großen Sprechermenge gesprochen werden - im Hinblick auf größere wirtschaftliche Erfolge (1). Das Clustering ähnlicher Sprachen macht es möglich, Forschung schrittweise aufzubauen (1).
Das Material soll aus möglichst vielen natürlichen Kommunikationssituationen und Lebenskontexten bestehen (1). Es sollen möglichst viele Daten von einer Person vorhanden sein, d.h. es sollte so gering wie möglich in die Kommunikationssituation eingegriffen werden, auch wenn dadurch die akustische Qualität unter Umständen sinken könnte (3). Statistisch basierte Ansätze sollen in der Erkennung und Synthese wieder zu Modellen führen, die die Realität enger abbilden (1). Die neuen Ressourcen sollen die praktische Nutzung realer, sinnvoller und gewünschter Applikationen bzw. Systeme repräsentieren (z.B. durch WOZ) (1).
Nach Meinung von 25 der befragten Experten sollten die Verantwortlichkeiten für die Grundlagenforschung besonders von nationalen (25), d.h. staatlichen, aber auch von internationalen (6) Instanzen getragen werden. Das Bundesministerium für Bildung und Forschung (BMBF) (1) und die Deutsche Forschungsgemeinschaft (DFG) könnten diese Funktion im nationalen Rahmen, die EU (1) und speziell gegründete Gruppen wie z.B. die 'Dialogue Encoding Initiative' (1) im internationalen Rahmen übernehmen. Die Universitäten in internationaler Kooperation sollten auch Träger dieser Aufgaben werden (4). Da bestimmte Grundlagen sprachunabhängig sind, sollten gerade diese Phänomene in internationalen Kooperationen erforscht werden (1), z.B. die internationale Förderung 'kleinerer' Sprachen (1).
Experten sprechen sich für eine konkrete Aufgabenteilung aus:
staatliche Aufgabe sollte beispielsweise die strikte Kontrolle
über Evaluationen (1) und die finanzielle Förderung (3) sein,
wobei die Universitäten und andere Forschungszentren die
Ausführung der Grundlagenforschung übernehmen (4). Die
Industrie soll zwar einen (finanziellen) Beitrag leisten und ein
gewisses Mitspracherecht haben, aber nie die Grundlagenforschung
diktieren (4). Da die vom Bildungsetat vorgesehenen Mittel nicht
ausreichen werden, wird langfristig die Unterstützung
durch große Firmen (3) und Stiftungen benötigt, jedoch soll deren
Beteiligung unter dem Vorbehalt einer engen Anlehnung an aktuelle
Forschungsbedürfnisse (2) stattfinden, d.h. die definierten Ziele
der Industrie dürfen keine einschränkende Wirkung auf die
Investition in die Grundlagenforschung haben (1). Andererseits sollte
darauf geachtet werden, eine anwendungsorientierte Forschung durch ein
nur eingeschränktes Mitspracherecht der Industrie nicht
außer Acht zu lassen (5),
denn auch eine schnelle Umsetzbarkeit von Ergebnissen aus der
Grundlagenforschung in konkrete Produkte sollte ein staatliches
Anliegen sein (1).
Bisher wurde die GF meist nur direkt entweder durch die
nationale Instanz oder die Industrie betrieben, was zu Problemen in der
Verfügbarkeit von Ressourcen geführt hat (2).
Frage 1: Berücksichtugung von Dialekten |
26 |
Frage 2: Bedarf an gemischt-sprachlichen
Ressourcen |
29 |
Frage 3: Bedarf an Zweitsprach-Ressourcen |
25 |
Frage 4: Korpus mit Fehlern in der Spontansprache | 31 |
Frage 5: Ausweitung auf Generationenkorpora |
29 |
Frage 6: Alter von Kindern für
Sprachdatenbank |
26 |
Frage 7: Sprachinhalte für Kinderdatenbank |
21 |
Frage 8: Anwendungsszenarien für
Kindersprachdatenbank |
25 |
Frage 9: Stellenwert der Information über
Emotionalität |
30 |
Frage 10: Biometrie zukünftsträchtig
und sicher |
22 |
Frage 11: Engere Zusammenarbeit zwischen
Institutionen |
37 |
Frage 12: Kooperation, jedoch individuelle
Produktentwicklung |
35 |
Frage 13: Zukünftige Regelungen zwischen
Institutionen |
35 |
Frage 14: Juristische Risiken |
23 |
Frage 15: Finanzielle Förderung neuer Sprachdatenbanken | 30 |
Frage 16: Ausgabendeckung durch Vertrieb |
24 |
Frage 17: Förderliche Faktoren für
Weiterentwicklung |
24 |
Frage 18: Hemmende Faktoren für die
Weiterentwicklung |
24 |
Frage 19: Integrierte Ressourcen und deren
Datenbereitstellung |
25 |
Frage 20: Aufnahmequalität und Art des
Inputs |
26 |
Frage 21: Aussprachemodelle der Zukunft |
23 |
Frage 22: Verwendungsbereiche mit künftigen
Innovationen |
30 |
Frage 23: Künftige Produkte ziviler Anwendungen | 27 |
Frage 24: Medizinische Anwendungen von
Sprachressourcen |
30 |
Frage 25: Mögliche künftige
Anwendungen von Biometrie |
23 |
Frage 26: Militärische Anwendungen |
18 |
Frage 27: Modifikationen oder Neugenerierungen neuer Produkte | 28 |
Frage 28: Produkte für Modifikation bzw.
Neugenerierung |
21 |
Frage 29: Sicherung seltener Sprachen |
24 |
Frage 30: Interessanter Markt bei seltenen
Sprachen |
11 |
Frage 31: Forschungsplanung der nächsten 10
Jahre |
31 |
Frage 32: Fragen der Grundlagenforschung |
26 |
Frage 33: Mehr oder weniger Grundlagenforschung |
32 |
Frage 34: Träger der Grundlagenforschung |
32 |