BAS
Bayerisches Archiv für Sprachsignale
Deutscher Gebärdensprachkorpus - SIGNUM
Same page in english
Beschreibung
Die SIGNUM Datenbank enthält sowohl isolierte als auch kontinuierliche Ausführungen von mehreren Gebärdensprechern. Da die Autoren einen videobasierten Ansatz zur Gebärdenspracherkennung verfolgen, wurde das Sprachkorpus mittels einer Videokamera aufgenommen. Um einen schnellen Direktzugriff auf die einzelnen Frames zu ermöglichen, wurde jede Aufnahme als Bildersequenz gespeichert.
Das Vokabular umfasst 450 Basisgebärden der Deutschen Gebärdensprache (DGS), die verschiedene Wortarten repräsentieren. Basierend auf diesem Vokabular wurden insgesamt 780 Gebärdensätze gebildet. Die Sätze variieren in der Länge von zwei bis elf Gebärden. Es existieren keine absichtlich eingelegten Pausen zwischen den Gebärden eines Satzes, jedoch sind die Sätze selber voneinander getrennt. Das gesamte Sprachkorpus, d.h. alle 450 Basisgebärden und 780 Gebärdensätze, wurden jeweils einmal von 25 Gebärdensprechern verschiedenen Geschlechts und Alters ausgeführt. Einer von ihnen wurde als sogenannter Referenzsprecher ausgewählt. Seine Ausführungen wurden dreimal aufgenommen.
Inhalt des Sprachkorpus:
- Sprache: Deutsche Gebärdensprache (DGS)
- Vokabulargröße: 450 Basisgebärden
- Anzahl der Sprecher: 25 Gebärdensprecher
- Anzahl der isolierten Gebärden: 450
- Anzahl der kontinuierlichen Sätze: 780
- Anzahl der Ausführungen:
* Referenzsprecher: 3
* übrige Sprecher: 1
- Gesamtzahl der Sequenzen: 33.210
- Gesamtzahl der Bilder: 5.970.450
- Äquivalente Videodauer: 55,3 Stunden
Technische Details:
- Bildauflösung: 776x578, 30fps, 24bpp, farbig
- Bildformat: JPEG (8:1 Kompression)
- Datenumfang: ca. 920GB
- Dateisystem: NTFS 3.1
- Medium: 1 Festplatte
Verfügbarkeit und Kosten
Frei verfügbar.
Deutscher Geärdensprachkorpus - SIGNUM
1 externe Festplatte NTFS 1000GB + Porto + Verpackung
Scientific EUR 1.000,- (ELRA Members EUR 600,-)
Commercial EUR 1.000,- (ELRA Members EUR 600,-)
Fragen und Orders bitte an
Florian Schiel