README zur VERBMOBIL Dialog-Datenbasis V 7.0.1 01.09.95 / 25.10.95 (You'll find the same text in English at the bottom of this file) C Copyright 1995 Universitaet Kiel, Unversitaet Bonn, Universitaet Muenchen. Alle Rechte vorbehalten, insbesondere ist die Weitergabe an Dritte auch auszugsweise, ohne Genehmigung der Urheber ausdruecklich untersagt. Die zugehoerigen Transliterationen (TRL files) sind auf dem offiziellen Verbmobil FTP Server in Saarbruecken (ftp.dfki.uni-sb.de) im Unterverzeichnis FTP-SERVER/vm-daten/trl gespeichert. Der Datentraeger (CDROM) bleibt bis zur Bezahlung der Schutzgebuehr an die Universitaet Muenchen Eigentum der Universitaet Muenchen. Software zum Lesen der Daten und Header-Information fuer verschiedene Betriebssysteme befinden sich im Subdirectory SOFTW. Sprecherinformationen finden Sie im Subdirectory DOC in der Datei AufDat.txt. Im Verzeichnis VIDEO befinden sich zum Dialog Z001D gehoerende Videoaufzeichnungen. Historie: V 7.0 : 1. Version, nur Signalfiles V 7.0.1 : Leere Audiofiles m232d/m232d029.e16 und m232d/m232d030.f16 geloescht Audiofile m062n/m062n003.b16 mit Phondat Header versehen Begriffe: Dialog = Gespraech zweier Personen mit ein oder mehreren Terminabsprachen Terminabsprache = Eine vollstaendige Vereinbarung eines Termins Turn = Ein einzelner Gespraechsbeitrag eines der Sprecher Struktur und Namen der Datenfiles: Jeder Dialog (Gespraech zweier Personen mit einer oder mehreren Terminabsprachen) ist durch folgenden Namen definiert: X###O mit X : Dialogtyp K = gleicher Raum, kein Knopfdruck L = getrennter Raum, kein Knopfdruck M = getrennter Raum, mit Knopfdruck N = gleicher Raum, mit Knopfdruck G = Knopfdruckverfahren (Kiel) Q = wie M, aber englisch R = wie N, aber englisch Z = Test-Dialog im Szenario 'Travel Planing', TP 13 "getrennter Raum" bedeutet: akustisch entkoppelt, aber Sichtkontakt und akustischer Kontakt ueber Kopfhoerer. "mit Knopfdruck" bedeutet: nur der Partner, der den Knopf drueckt, wird aufgenommen; gleichzeitiges Sprechen nicht moeglich. ### : Dialognummer eines Aufnahme-Instituts O : Ortskennung Aufnahme-Institut A : Kiel C : CMU D : Muenchen N : Bonn K : Karlsruhe Alle Daten zu einem Dialog sind in einem Subdirektory mit dem Namen des Dialogs gespeichert, z.B. Q001N Dateien eines Dialogs: A Transliteration (Extension .TRL), ASCII, z.B. M001D.TRL B Gesamter Dialog (Extension .STF), Stereofile ohne Header, abwechselnd linker und rechter Kanal, Motorola Worte, 16 Bit, 16000 Hz Abtastrate, z.B. M001D.STF (OPTIONAL fuer Muenchner Dialoge) C Einzelne Beitraege (Turns), Namensgebung: X%%%O***.&16 mit X : s.o. %%% : s.o. O : s.o. *** : Turnnummer (Beginn mit 000) & : Termin-Nummerierung A : 1. Termin des Dialogs B : 2. " ... 16 : Sprachsignal mit 16 kHz Header Phondat 1 (siehe Dokumentation in DOC/PHONDAT.DOC), Intel Worte, 16 Bit, 16000 Hz Abtastrate, z.B. MSTAD001.A16 Bemerkungen: - Uebersteuerungen (clipping) innerhalb der Sprachsignale koennen durch Lesen der Header-Information abs_max (absolute Maximalamplitude) festgestellt werden. Wenn dieser Wert 32767 ist (Karlsruhe: 32764 o. 32767), kommt es zu min. einer Uebersteuerung. - Daten des Headers wie die Daten des Signals sind immer als Intel Daten gespeichert. =========================================================================== README VERBMOBIL Dialog Database V 7.0 01.09.95 / 05.09.95 C Copyright 1995 University of Kiel, Unversity of Bonn, University of Munich. All rights reserved. This corpus and software may not be disseminated further - not even partly - without a written permission of the copyright holders. The files containing the orthographig/linguistic transliteration to the signals are stored on the official Verbmobil FTP Server (ftp.dfki.uni-sb.de) in the subdirectory FTP-SERVER/vm-daten/trl. The CDROM stays a property of the University of Munich until the costs for production and shipping are paid. You will find software for reading/writing/playing/converting the files for several OS in the subdir SOFTW. You will find speaker information in the file AufDat.txt in the subdir DOC. The subdir VIDEO contains video recordings of one speaker during a recording session (Z001D). History: V 7.0 : only signal files V 7.0.1 : Empty audio files m232d/m232d029.e16 und m232d/m232d030.f16 deleted Audio file m062n/m062n003.b16 patched with Phondat header Terms: dialog = conversation between two persons about one or more appointments appointment = complete negotiation about one appointment (several turns) turn = single, non interrupted utterance of one speaker Structure and names of signal files: Each dialog has a defined name as follows: X###O X : Dialog type K = same room, no push button L = seperated room, no push button M = seperated room, push button N = same room, push button G = push button (Kiel) Q = same as M but english R = same as N but english Z = test recording in the szenario 'travel planning' by TP 13 Hamburg 'seperated room' = acoustically seperated, but eye contact through window, acoustical contact only via headphones. 'push button' = only the speaker that has pressed the button is recorded, pushing simultaneously is not possible. ### : dialog number within a recording site (starting 001) O : ID recording site A : Kiel C : CMU D : Muenchen N : Bonn K : Karlsruhe All data to a dialog are stored in a seperate subdir named as the dialog, e.g. Q001N Files of a dialog: A Transliteration (Extension .TRL), ASCII, e.g. M001D.TRL B Whole Dialog (Extension .STF), stereo file without header, interleafed (OPTIONAL, not on this volume ) C Turns, file naming: X%%%O***.&16 X : see above %%% : see above O : see above & : number of appointment (if more than one) A : 1st appointment B : 2nd " ... 16 : PhonDat signal file 16 kHz sampling rate Header is PhonDat 1 (see doc file DOC/PHONDAT.DOC) Intel words, 16 bit, 16000 Hz sampling rate. Remarks: - Clipping within the speech signal can be detected by checking the header item abs_max (maximal absolute amplitude). - Items of the headers are always stored as Intel word or long words.