README zur VERBMOBIL Dialog-Datenbasis VM 2.0 13.05.94 / 31.10.95 (You'll find the same text in English at the bottom of this file) C Copyright 1994 Universitaet Muenchen, Universitaet Karlsruhe, Universitaet Kiel, Unversitaet Bonn. Alle Rechte vorbehalten, insbesondere ist die Weitergabe an Dritte ausserhalb des BMfT Projekts "VERBMOBIL" auch auszugsweise, ohne Genehmigung der Urheber ausdruecklich untersagt. Die Weitergabe an Projektpartner des BMfT Projekts "VERBMOBIL" ist gestattet. Die zugehoerigen Transliterationen befinden sich im Subdirectory TRL. Es handelt sich dabei um die Orginal Verbmobil Transliteration nach Handbuch Version 3.0 vom 15.06.95. Der Datentraeger (CDROM) bleibt bis zur Bezahlung der Schutzgebuehr an das Bayerische Archiv fuer Sprachsignale (BAS) Eigentum des BAS, Universitaet Muenchen. Software zum Lesen der Daten und Header-Information fuer verschiedene Betriebssysteme befinden sich im Subdirectory SOFTW. Sprecherinformationen finden Sie im Subdirectory DOC in der Datei AufDat.txt. Beachten Sie, dass nur die jeweils letzte Version der Verbmobil Sprecherdatenbasis AufDat.txt Gueltigkeit hat. Bitte laden Sie dazu die aktuellste Version der Sprecherdatenbasis vom offiziellen Verbmobil FTP- Server (directory: FTP-SERVER/vm-daten/trl) oder von folgender URL: http://www.phonetik.uni-muenchen.de/Verbmobildeu.html Eine Postscript Version des aktuellen Transliterationslexikons finden Sie im File trllex_d.ps im Subdirectory DOC. Verwenden Sie nach Moeglichkeit immer die letzte Version dieses Lexikons unter folgender URL: http://www.phonetik.uni-muenchen.de/VMTraLex.html Historie: 2.0 : 1. Version, nur Signalfiles Begriffe: Dialog = Gespraech zweier Personen mit ein oder mehreren Terminabsprachen Terminabsprache = Eine vollstaendige Vereinbarung eines Termins Turn = Ein einzelner Gespraechsbeitrag eines der Sprecher Struktur und Namen der Datenfiles: Jeder Dialog (Gespraech zweier Personen mit einer oder mehreren Terminabsprachen) ist durch folgenden Namen definiert: X###O mit X : Dialogtyp K = gleicher Raum, kein Knopfdruck L = getrennter Raum, kein Knopfdruck M = getrennter Raum, mit Knopfdruck N = gleicher Raum, mit Knopfdruck G = Knopfdruckverfahren (Kiel) Q = wie M, aber englisch R = wie N, aber englisch "getrennter Raum" bedeutet: akustisch entkoppelt, aber Sichtkontakt und akustischer Kontakt ueber Kopfhoerer. "mit Knopfdruck" bedeutet: nur der Partner, der den Knopf drueckt, wird aufgenommen; gleichzeitiges Sprechen nicht moeglich. ### : Dialognummer eines Aufnahme-Instituts O : Ortskennung Aufnahme-Institut A : Kiel C : CMU D : Muenchen N : Bonn K : Karlsruhe Alle Daten zu einem Dialog sind in einem Subdirektory mit dem Namen des Dialogs gespeichert, z.B. Q001N Dateien eines Dialogs: A Transliteration (Extension .TRL), ASCII, z.B. M001D.TRL B Gesamter Dialog (Extension .STF), Stereofile ohne Header, abwechselnd linker und rechter Kanal, Motorola Worte, 16 Bit, 16000 Hz Abtastrate, z.B. M001D.STF (OPTIONAL fuer Muenchner Dialoge) C Einzelne Beitraege (Turns), Namensgebung: X%%%O***.&16 mit X : s.o. %%% : s.o. O : s.o. *** : Turnnummer (Beginn mit 000) & : Termin-Nummerierung A : 1. Termin des Dialogs B : 2. " ... 16 : Sprachsignal mit 16 kHz Header Phondat 1 (siehe Dokumentation in DOC/PHONDAT.DOC), Intel Worte, 16 Bit, 16000 Hz Abtastrate, z.B. MSTAD001.A16 Bemerkungen: - Die Dialoge M112D bis M125D der CDROM 2.0. bestehen jeweils aus vier einzelnen Terminabsprachen. Jede Terminabsprache innerhalb eines Dialoges wird mit einem neuen Kennbuchstaben (A, B, C, D) in der Extension eingeleitet, die Turn-Nummerierung wird dagegen durchgehend fortgesetzt (s.o.). Die Dialoge G101A bis G315A enthalten jeweils 3 Terminabsprachen, die Dialoge M016N bis M021N jeweils 8. In beiden F"allen sind die einzelnen Terminabsprachen nicht weiter markiert. Daher haben alle Datenfiles die Extension 'A16', obwohl sie mehr als nur eine Terminabsprache enthalten. - Uebersteuerungen (clipping) innerhalb der Sprachsignale koennen durch Lesen der Header-Information abs_max (absolute Maximalamplitude) festgestellt werden. Wenn dieser Wert 32767 ist (Karlsruhe: 32764 o. 32767), kommt es zu min. einer Uebersteuerung. - Daten des Headers wie die Daten des Signals sind immer als Intel Daten gespeichert. =========================================================================== README VERBMOBIL Dialog Database VM 2.0 13.05.94 / 15.07.95 C Copyright 1994 Universitaet Muenchen, Universitaet Karlsruhe, Universitaet Kiel, Unversitaet Bonn. All rights reserved. This corpus and software may not be disseminated further - not even partly - without a written permission of the copyright holders. The files containing the orthographig/linguistic transliteration to the signals are stored in the subdirectory TRL. The CDROM stays a property of the Bavarian Archive for Speech Signals (BAS) until the costs for production and shipping are paid to the BAS. You will find software for reading/writing/playing/converting the files for several OS in the subdir SOFTW. You will find speaker information in the file AufDat.txt in the subdir DOC. NOTE: Please lookup the latest version of the Verbmobil speaker database AufDat.txt from the official Verbmobil FTP-SERVER (directory: FTP-SERVER/vm-daten/trl) or lookup the following URL: http://www.phonetik.uni-muenchen.de/Verbmobil.html A Postscript version of the actual transliteration lexicon can be found in the file trllex_e.ps in the subdir DOC. NOTE: If possible, please use the latest version of the transliteration lexicon under following URL: http://www.phonetik.uni-muenchen.de/VMTraLexeng.html History: 2.0 : only signal files Terms: dialog = conversation between two persons about one or more appointments appointment = complete negotiation about one appointment (several turns) turn = single, non interrupted utterance of one speaker Structure and names of signal files: Each dialog has a defined name as follows: X###O X : Dialog type K = same room, no push button L = seperated room, no push button M = seperated room, push button N = same room, push button G = push button (Kiel) Q = same as M but english R = same as N but english 'seperated room' = acoustically seperated, but eye contact through window, acoustical contact only via headphones. 'push button' = only the speaker that has pressed the button is recorded, pushing simultaneously is not possible. ### : dialog number within a recording site (starting 001) O : ID recording site A : Kiel C : CMU D : Muenchen N : Bonn K : Karlsruhe All data to a dialog are stored in a seperate subdir named as the dialog, e.g. Q001N Files of a dialog: A Transliteration (Extension .TRL), ASCII, e.g. M001D.TRL B Whole Dialog (Extension .STF), stereo file without header, interleafed (OPTIONAL, not on this volume ) C Turns, file naming: X%%%O***.&16 X : see above %%% : see above O : see above & : number of appointment (if more than one) A : 1st appointment B : 2nd " ... 16 : PhonDat signal file 16 kHz sampling rate Header is PhonDat 1 (see doc file DOC/PHONDAT.DOC) Intel words, 16 bit, 16000 Hz sampling rate. Remarks: - The dialogs M112D to M125D of VM 2.0 contain 4 appointments each. Each appointment is marked by letters in the extension (A, B, C, D). The turn numbering continues throughout the dialog. The dialogs G101A to G315A contain 3 appointments each, the dialogs M016N to M021N contain 8 appointments each. These are not marked in the extension (therefore all extensions of these files are 'A16'). - Clipping within the speech signal can be detected by checking the header item abs_max (maximal absolute amplitude). - Items of the headers are always stored as Intel word or long words.