BAS
Bayerisches Archiv für Sprachsignale
SmartKom - SKM

Letzter Update: 2012-02-29 - same page in english

Allgemeines

Das SmartKom-Korpus wurde in den Jahren 2000-2003 am BAS im Rahmen des BMB+F-Leitprojekts SmartKom produziert. Das Korpus enthält 466 multimodale Aufnahmen ('Sessions') in einem Wizard-of-Oz-Szenario von 224 Versuchspersonen. Nähere Informationen zur Korpusproduktion finden sich hier; eine Übersicht über den gesamten Korpus wurde auf der LREC 2002 veröffentlicht.

Die Release SKM 1.0 enthält Aufnahmen im technischen Setup ('scenario') SmartKom Mobil. Dabei handelt es sich um einen PDA mit Netzverbindung zum SmartKom-Server und multimodalen Kommunikationsmöglichkeiten. Naive Versuchspersonen, die nicht wussten, dass es sich um eine Simulation handelt, benutzten diesen (simulierten) PDA zweimal für jeweils 4,5 Minuten, während derer sie eine Aufgabe aus einer bestimmten Domäne zu lösen hatten; die VPs waren mit dem System allein gelassen und hatten nur eine minimale Instruktion: Es wurde lediglich mitgeteilt, dass das System Sprache und 2D-Gesten mit dem Eingabestift verstehe.
Die Experimente wurden nicht im Feld durchgeführt sondern in kontrollierter Umgebung in einem Studio. Die VPs hielten den PDA nicht in der Hand sondern sahen nur die Videoausgabe vor sich auf einem Graphik-Tableau, auf das sie Eingaben mit dem Stift machen konnten. Die Sprache wurde u.a. mit einem Headset erfasst.

Wichtigste technische Daten des Release SKM 1.0

Original READMEs

Aufnahme-Sessions : Übersicht

Diese Tabelle enthält eine Übersicht über alle SmartKom Aufnahme-Sessions. Pro Session ist genau eine Zeile mit 35 Spalten enthalten. Diese enthalten Angaben über Session-Nummer und Volume-Nummer (Spalte 1-2), aufgenommene Modalitäten (Spalte 3-20), Annotationen (Spalte 21-26) sowie einige Merkmale der beteiligten Versuchsperson.
Nicht alle Aufnahme-Sessions enthalten alle Modalitäten und/oder Annotationen; die obige Tabelle soll helfen, die Aufnahme-Sessions zu finden, die für einen bestimmten Zweck relevant sind.

Verfügbarkeit und Distributionsgebühren

Das SmartKom Korpus wurde mit öffentlichen Geldern und Mitteln des BAS finanziert und ist daher lizenzfrei verfügbar. Eine Weitergabe des Korpus oder auch Teilen oder Auszügen davon an Dritte ist nicht gestattet. Ansonsten unterliegt die Nutzung keinerlei Beschränkungen

Das Korpus ist in Volumes gegliedert, wobei i.A. jedes Volume eine Aufnahme-Session enthält (ca. 4,3 - 4,7 GByte). Zur Auswahl individueller Volumes verwenden Sie bitte die o.g. Übersichtstabelle.
Bei individueller Bestellung einzelner Volumes beträgt die Gebühr für ein Volume 1 BAS Distributionsgebühr:

SmartKom Single Volume
1 DVD-5 UDF + Porto + Verpackung
EUR 255,65 (ELRA Members 50% discount)

Die Gebühr für das gesamte Release SKM auf USB Harddisc beträgt:

SmartKom SKM
1 USB HD + Porto + Verpackung
EUR 4.500,- (ELRA Members 3.000,-)

Es ist problemlos möglich, nur Auszüge des Korpus zu bestellen. Z.B. alle Aufnahmen des frontalen Videos (Gesicht) zusammen mit den User-State Labelungen oder nur Audio-Signale zusammen mit Transliteration. Die Distributionsgebühr richtet sich in diesem Falle nach dem Umfang der Daten (1 BAS Distributionsgebühr pro gebrannte DVD-5).

Beachten Sie auch die spezielle Ausgabe SKAUDIO nur mit Sprachaufnahmen.

Fragen und Orders bitte an


Florian Schiel