BAS
Bayerisches Archiv für Sprachsignale
SmartKom - SKM
Letzter Update: 2012-02-29 - same page in english
Allgemeines
Das SmartKom-Korpus wurde in den Jahren 2000-2003 am BAS im Rahmen
des BMB+F-Leitprojekts SmartKom
produziert. Das Korpus enthält 466 multimodale Aufnahmen ('Sessions') in einem
Wizard-of-Oz-Szenario von 224 Versuchspersonen. Nähere Informationen
zur Korpusproduktion finden sich hier; eine Übersicht über den gesamten
Korpus wurde auf der LREC 2002 veröffentlicht.
Die Release SKM 1.0 enthält Aufnahmen im technischen Setup ('scenario')
SmartKom Mobil. Dabei handelt es sich um einen PDA mit Netzverbindung
zum SmartKom-Server und multimodalen Kommunikationsmöglichkeiten.
Naive Versuchspersonen, die nicht wussten, dass es sich um eine Simulation
handelt, benutzten diesen (simulierten) PDA zweimal für jeweils 4,5 Minuten, während
derer sie eine Aufgabe aus einer bestimmten Domäne zu lösen hatten; die VPs
waren mit dem System allein gelassen und hatten nur eine minimale
Instruktion: Es wurde lediglich
mitgeteilt, dass das System Sprache und 2D-Gesten mit dem Eingabestift
verstehe.
Die Experimente wurden nicht im Feld durchgeführt sondern in kontrollierter
Umgebung in einem Studio. Die VPs hielten den PDA nicht in der Hand sondern
sahen nur die Videoausgabe vor sich auf einem Graphik-Tableau, auf das sie
Eingaben mit dem Stift machen konnten. Die Sprache wurde u.a. mit einem Headset
erfasst.
Wichtigste technische Daten des Release SKM 1.0
- Technisches Setup: Mobil (Szenario)
- Hauptdomäne 'Tourism'; Nebendomäne 'Telephony'
- Hauptdomäne 'Navigation'; Nebendomäne 'Looking for parking place'
- 73 Versuchspersonen
- 146 Aufnahme-Sessions; Umfang: 490 GByte
- Aufgenommene Modalitäten:
- Audio in 9 Kanälen
- Video Gesichtsfeld
- Video Oberkörper von links
- Infrarot-Video des Displaybereichs von oben (zur Erfassung
der 2D-Gestik)
- Video des graphischen Displays (Beamers)
- Koordinaten Graphiktableau (wenn Stift benutzt wurde)
- Koordinaten SIVIT Einheit (wenn Finger/hnad benutzt wurde)
- Annotationen:
- Transliteration
- 2D Gestik
- User-State in drei verschiedenen Modalitäten
- Turn-Segmentierung
- Volle Dokumentation, TechDoks und Veröffentlichungen
- Alle Annotationen kompatibel zum 'BAS Partitur Format' (BPF)
Original READMEs
Aufnahme-Sessions : Übersicht
Diese Tabelle enthält eine Übersicht über alle SmartKom Aufnahme-Sessions.
Pro Session ist genau eine Zeile mit 35 Spalten enthalten.
Diese enthalten Angaben
über Session-Nummer und Volume-Nummer (Spalte 1-2), aufgenommene Modalitäten
(Spalte 3-20), Annotationen (Spalte 21-26) sowie einige Merkmale
der beteiligten Versuchsperson.
Nicht alle Aufnahme-Sessions enthalten alle Modalitäten und/oder Annotationen;
die obige Tabelle soll helfen, die Aufnahme-Sessions zu finden, die für
einen bestimmten Zweck relevant sind.
Verfügbarkeit und Distributionsgebühren
Das SmartKom Korpus wurde mit öffentlichen Geldern und Mitteln des BAS
finanziert und ist daher lizenzfrei verfügbar. Eine Weitergabe des Korpus
oder auch Teilen oder Auszügen davon an Dritte ist nicht gestattet. Ansonsten
unterliegt die Nutzung keinerlei Beschränkungen
Das Korpus ist in Volumes gegliedert, wobei i.A. jedes Volume eine
Aufnahme-Session enthält (ca. 4,3 - 4,7 GByte). Zur Auswahl individueller
Volumes verwenden Sie bitte die o.g. Übersichtstabelle.
Bei individueller Bestellung
einzelner Volumes beträgt die Gebühr für ein Volume 1 BAS Distributionsgebühr:
SmartKom Single Volume
1 DVD-5 UDF + Porto + Verpackung
EUR 255,65 (ELRA Members 50% discount)
Die Gebühr für das gesamte Release SKM auf USB Harddisc beträgt:
SmartKom SKM
1 USB HD + Porto + Verpackung
EUR 4.500,- (ELRA Members 3.000,-)
Es ist problemlos möglich, nur Auszüge des Korpus zu bestellen. Z.B. alle
Aufnahmen des frontalen Videos (Gesicht) zusammen mit den User-State
Labelungen oder nur Audio-Signale zusammen mit Transliteration.
Die Distributionsgebühr richtet sich in diesem Falle
nach dem Umfang der Daten (1 BAS Distributionsgebühr pro gebrannte DVD-5).
Beachten Sie auch die spezielle Ausgabe SKAUDIO nur mit Sprachaufnahmen.
Fragen und Orders bitte an
Florian Schiel