README zur VERBMOBIL Dialog-Datenbasis VM 4.0 31.03.95 / 10.04.95 C Copyright 1994 Universitaet Muenchen, Universitaet Kiel, Unversitaet Bonn, Universitaet Karlsruhe. Alle Rechte vorbehalten, insbesondere ist die Weitergabe an Dritte ausserhalb des BMFT Projekts "VERBMOBIL" auch auszugsweise, ohne Genehmigung der Urheber ausdruecklich untersagt. Die Weitergabe an Projektpartner des BMFT Projekts "VERBMOBIL" ist gestattet. Der Datentraeger (CDROM) bleibt bis zur Bezahlung der Schutzgebuehr an die Universitaet Muenchen Eigentum der Universitaet Muenchen. Informationen zu den Daten und file Formaten im Subdirectory DOC. Beispiel-Software zum Lesen der Daten in ANSI-C befindet sich im Subdirectory SOFTW. VM CD 4.0 enthaelt - 72 Dialoge - 181 Terminabsprachen Historie: 4.0 : 1. Version, nur Signalfiles Begriffe: Dialog = Gespraech zweier Personen mit ein oder mehreren Terminabsprachen Terminabsprache = Eine vollstaendige Vereinbarung eines Termins Turn = Ein einzelner Gespraechsbeitrag eines der Sprecher Struktur und Namen der Datenfiles: Jeder Dialog (Gespraech zweier Personen mit einer oder mehreren Terminabsprachen) ist durch folgenden Namen definiert: X###O mit X : Dialogtyp K = gleicher Raum, kein Knopfdruck L = getrennter Raum, kein Knopfdruck M = getrennter Raum, mit Knopfdruck N = gleicher Raum, mit Knopfdruck G = Knopfdruckverfahren (Kiel) "getrennter Raum" bedeutet: akustisch entkoppelt, aber Sichtkontakt und akustischer Kontakt ueber Kopfhoerer. "mit Knopfdruck" bedeutet: nur der Partner, der den Knopf drueckt, wird aufgenommen; gleichzeitiges Sprechen nicht moeglich. ### : Dialognummer eines Aufnahme-Instituts O : Ortskennung Aufnahme-Institut A : Kiel D : Muenchen N : Bonn K : Karlsruhe Alle Daten zu einem Dialog sind in einem Subdirektory mit dem Namen des Dialogs gespeichert, z.B. M001D Dateien eines Dialogs: A Transliteration (Extension .TRL), ASCII, z.B. M001D.TRL Die Transliterationen befinden sich nicht auf dieser CDROM. Sie koennen per FTP vom VM Server in Saarbruecken bezogen werden. B Einzelne Beitraege (Turns), Namensgebung: X%%%O***.&16 mit X : Dialogtyp K = gleicher Raum, kein Knopfdruck L = getrennter Raum, kein Knopfdruck M = getrennter Raum, mit Knopfdruck N = gleicher Raum, mit Knopfdruck G = Knopfdruchverfahren (Kiel). %%% : Dialognummer O : Ortskennung Aufnahme-Institut A : Kiel D : Muenchen N : Bonn K : Karlsruhe *** : Turnnummer & : Termin-Nummerierung V : Vorgespraech (optional) A : 1. Termin des Dialogs B : 2. " ... bzw. Kanal-Kodierung A: linker Kanal B: rechter Kanal 16 : Sprachsignal mit 16 kHz Header Phondat 1, Intel Worte, 16 Bit, 16000 Hz Abtastrate. Die Turn-Nummerierung beginnt mit 000 und wird fuer den ganzen Dialog fortlaufend durchgef"uhrt. Anmerkung: Die Dialoge M*D bestehen jeweils aus vier einzelnen Terminabsprachen. Jede Terminabsprache innerhalb eines Dialoges wird mit einem neuen Kennbuchstaben (A, B, C, D) in der Extension eingeleitet, die Turn-Nummerierung wird dagegen durchgehend fortgesetzt (s.o.). Die Dialoge G*A enthalten jeweils 3 Terminabsprachen. Die Extensionen ".A16" und ".B16" kennzeichnen den Kanal. Die einzelnen Terminabsprachen sind nicht weiter gekennzeichnet. Die Dialoge M*N enthalten 3 Terminabsprachen, Jede Terminabsprache innerhalb eines Dialoges wird mit einem neuen Kennbuchstaben (A, B, C, D) in der Extension eingeleitet, die Turn-Nummerierung wird dagegen durchgehend fortgesetzt (s.o.). Die Dialoge N*K enthalten jeweils nur eine Terminabsprache.