BAS
Bayerisches Archiv für Sprachsignale
Verbmobil II - VM2
Same page in english
Verbmobil II
Aufnahmen 1997 - 2000
Der Verbmobil II Korpus enthält i.G. zu VM I Aufnahmen mit überlappenden
Redebeiträgen. Ausserdem wurde die Domain erweitert und ein neues
Format der Transliteration entwickelt (Daten von VM I wurden in dieses
neue Format übersetzt und der BAS-Edition der VM I CDs beigefügt).
Die Original-Edition von VM II unterscheidet sich von der BAS-Edition
darin, dass die Dialoge zweispurig mit allen Gesprächspausen
aufgezeichnet wurden. Aus Kompatibilitätsgründen zu VM I wurden die
Signale in der BAS-Edition analog zu VM I geschnitten. Die Original-Edition
wird in diesem Katalog nicht mehr aufgeführt, kann aber auf Wunsch über das
BAS bezogen werden (Preise analog zur BAS-Edition).
445 Sprecher wurden in 810 Aufnahmesitzungen erfasst (ohne die
Emotions-Sprache auf Volume 63-65). Der gesamte VMII Korpus ist
17.6 GB groß und enthält 58961 Dialogbeiträge
auf 39 CD-R (+ 3 CD-R Emotionssprache).
Weitere allgemeine Informationen zum VM II Korpus finden sich
hier.
Informationen zur Struktur und zu möglichen Teilmengen
des VM Korpus finden sich
hier.
Informationen zur Aufteilung des deutschen VM Korpus
in Trainings-, Development- und Test-Korpus
finden sich
hier.
History betreffend alle VMII Volumes:
- 30.05.2001 : Neuausgabe aller BAS Partitur Files (BPF) auf der Basis
der letzten Fehlerupdates. Dies beinhaltet auch eine Neuberechnung der
MAUS-Daten, sowie die Neuaufnahme weiterer Spuren von
VMII-Projekt-Partnern, die bis dato nicht veröffentlicht wurden.
(Syntax-Bäume, Dialogakt-Labelung, syntaktisch-prosodische Labelung, prosodische
Labelungen, Parts-of-Speech-Tags, Lemmata)
- 07.06.2001 : Ausgabe der VM Bonus-CD (VMBONUS) mit zusaetzlichem
Datenmaterial und Dokumentationen; Ausgabe der VM Lexikon Datenbank der
Universität Bielefeld.
- 10.07.2001 : BPF Spuren LBP und LBG integriert
- 13.12.2001 : Fehler in BPF Spur PRO beseitigt
- 14.03.2002 : Formatfehler in Linkliste der PRO Spur beseitigt
- 01.08.2002 : Fehler in der MAU Spur von g002acn2_033_AAK.par und
g426acn1_020_AMA.par korrigiert
- 30.01.03 : vm_ger.lex completely re-build:
The German pronunciation dir of VM I+II now contains only the
word items as they appear in the ORT tier of the BPF files.
Also the transcription was unified to a more consistant
concept of a 'canonical form'.
- 19.08.03 : New edition of all BAS Partitur Files (BPF) of German signal data
based on the latest error update:
Some minor bugs in the POS, LMA and SAP tiers fixed.
Complete re-done pronunciation list for German (vm_ger.lex)
according to the new 'Transliteration Conventions for Canonical
German' (www.bas.uni-muenchen.de/Bas/BasGermanPronunciation/)
Based on the new pronunciation the following tiers in the BPF
files have been re-calculated:
KAN, MAU
- 20.08.03 : New tier TLN integrated : the TLN tier contains the translation
of the recorded utterance. The transliterations were produced
manually by the University of Tuebingen, Prof. Hinrichs.
The integrated data are also stored on the volume VMBONUS
Please note that the orthographic representation of Japanese
(romanji) in these translations is of the original form as used
in the original Japanese pronunciation list (vm_jap_org.lex).
However, it was never check whether these two data sets (lexicon
and translations) are in fact compatible. Use with caution!
For details about the TLN tier please refer to the BPF documentation
www.bas.uni-muenchen.de/Bas/BasFormatseng.html
- 09.09.03 : Published defined training, development and test sub sets
Volumes:
- Verbmobil -
VM CD 15.1 - VM15.1
(new edition)
German - 57 spontane Dialoge (19 close mic, 19 room mic,
19 phone line (GSM)) - 3117 Turns
- Transliteration (VM II Format)
-
NIST Header
- Partitur Files
- Verbmobil -
VM CD 20.1 - VM20.1
(new edition)
German - 31 spontane Dialoge (10 close mic, 28 room mic,
10 phone line (GSM) recordings) - 1947 Turns
- Transliteration (VM II Format)
-
NIST Header
- Partitur Files
- Verbmobil -
VM CD 21.1 - VM21.1
(new edition)
German - 38 spontane Dialoge (38 close mic, 20 room mic,
22 phone line (GSM) recordings) - 2880 Turns
- Transliteration (VM II Format)
-
NIST Header
- Partitur Files
- Verbmobil - VM CD 22.1 - VM22.1 (BAS-Edition)
German - 33 spontane Dialoge (33 close mic, 22 room mic, 27 phone line
(GSM) recordings) - 2674 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 23.1 - VM23.1 (BAS-Edition)
American English - 28 spontane Dialoge (28 close mic, 0 room mic, 0 phone line (GSM) recordings) - 2459 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 24.1 - VM24.1 (BAS-Edition)
German - 34 spontane Dialoge (34 close mic, 19 room mic, 20 phone line
(GSM) recordings) - 2830 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 25.1 - VM25.1 (BAS-Edition)
Japanese - 10 spontane Dialoge (10 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1654 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 26.1 - VM26.1 (BAS-Edition)
Japanese - 16 spontane Dialoge (16 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1319 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 27.1 - VM27.1 (BAS-Edition)
Japanese - 24 spontane Dialoge (24 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1149 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 28.1 - VM28.1 (BAS-Edition)
American English - 28 spontane Dialoge (28 close mic, 0 room mic, 0 phone line (GSM) recordings) - 2409 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 29.1 - VM29.1 (BAS-Edition)
German - 25 spontane Dialoge (25 close mic, 20 room mic, 20 phone line
(GSM) recordings) - 2708 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 30.1 - VM30.1 (BAS-Edition)
German - 33 spontane Dialoge (33 close mic, 21 room mic, 25 phone line
(GSM) recordings) - 4176 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 31.1 - VM31.1 (BAS-Edition)
American English - 32 spontane Dialoge (32 close mic, 0 room mic, 0 phone line (GSM) recordings) - 2512 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 32.1 -
VM32.1 (BAS-Edition)
Multilingual English/German - 17 spontane Dialoge (17 close mic, 0 room mic, 0 phone line (GSM) recordings) - 992 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 33.1 - VM33.1 (BAS-Edition)
Japanese - 25 spontane Dialoge (25 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1050 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 34.1 - VM34.1 (BAS-Edition)
Japanese - 28 spontane Dialoge (28 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1437 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 35.1 - VM35.1 (BAS-Edition)
Japanese - 27 spontane Dialoge (27 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1645 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 38.1 - VM38.1 (BAS-Edition)
German - 33 spontane Dialoge (33 close mic, 28 room mic, 28 phone line
(GSM) recordings) - 5115 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 39.1 - VM39.1 (BAS-Edition)
German - 28 spontane Dialoge (28 close mic, 17 room mic, 20 phone line
(GSM) recordings) - 3360 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 42.1 - VM42.1 (BAS-Edition)
American English - 20 spontane Dialoge (20 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1874 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 43.1 - VM43.1 (BAS-Edition)
American English - 11 spontane Dialoge (11 close mic, 0 room mic, 0 phone line (GSM) recordings) - 633 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 44.1 - VM44.1 (BAS-Edition)
Japanese - 19 spontane Dialoge (19 close mic, 0 room mic, 0 phone line
(GSM) recordings) - 920 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 45.1 - VM45.1 (BAS-Edition)
Japanese - 21 spontane Dialoge (21 close mic, 0 room mic, 0 phone line (GSM) recordings) - 1293 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 46.1 - VM46.1 (BAS-Edition)
Multilingual Japanese/German - 11 spontane Dialoge (11 close mic, 0 room mic, 0 phone line (GSM) recordings) - 607 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 47.1 - VM47.1 (BAS-Edition)
Multilingual mit Simultanübersetzer (3 Kanäle) English/German - 17 spontane Dialoge (17 close mic, 0 room mic, 0 phone line (GSM) recordings) - 902 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 48.1 - VM48.1 (BAS-Edition)
German - 28 spontane Dialoge (28 close mic, 23 room mic, 27 phone line (GSM) recordings) - 4516 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 49.1 - VM49.1 (BAS-Edition)
German - 24 spontane Dialoge (24 close mic, 12 room mic, 12 phone line (GSM) recordings) - 2597 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 50.1 - VM50.1 (BAS-Edition)
American English - 8 spontane Dialoge (8 close mic, 0 room mic, 0 phone line (GSM) recordings) - 679 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 51.1 - VM51.1 (BAS-Edition)
Multilingual German/English with human interpreter (3 channels) - 15 spontane Dialoge (15 close mic, 0 room mic, 0 phone line (GSM) recordings) - 873 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 52.1 - VM52.1 (BAS-Edition)
Multilingual German/English with human interpreter (3 channels) - 13 spontane Dialoge (13 close mic, 0 room mic, 0 phone line (GSM) recordings) - 728 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 53.1 - VM53.1 (BAS-Edition)
German - 16 spontane Dialoge (16 close mic, 8 room mic, 8 phone line (GSM) recordings) - 1771 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 55.1 - VM55.1 (BAS-Edition)
Multilingual German/English with human interpreter (3 channels) - 11 spontane Dialoge (11 close mic, 0 room mic, 0 phone line (GSM) recordings) - 518 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 56.1 - VM56.1 (BAS-Edition)
Multilingual German/English with human interpreter (3 channels) - 12 spontane Dialoge (12 close mic, 0 room mic, 0 phone line (GSM) recordings) - 620 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 57.1 - VM57.1 (BAS-Edition)
Multilingual German/Japanese with 2 human interpreters (4 channels) - 11 spontane Dialoge (11 close mic, 0 room mic, 0 phone line (GSM) recordings) - 702 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 58.1 - VM58.1 (BAS-Edition)
Multilingual German/Japanese with 2 human interpreters (4 channels) - 7 spontane Dialoge (7 close mic, 0 room mic, 0 phone line (GSM) recordings) - 421 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 59.1 - VM59.1 (BAS-Edition)
Multilingual German/Japanese with 2 human interpreters (4 channels) - 7 spontane Dialoge (7 close mic, 0 room mic, 0 phone line (GSM) recordings) - 354 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 60.1 - VM60.1 (BAS-Edition)
Japanese - 10 spontane Dialoge (10 close mic, 0 room mic, 0 phone line (GSM) recordings) - 501 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 61.1 - VM61.1 (BAS-Edition)
Japanese - 19 spontane Dialoge (19 close mic, 0 room mic, 0 phone line (GSM) recordings) - 946 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 62.1 - VM62.1 (BAS-Edition)
Japanese - 21 spontane Dialoge (21 close mic, 0 room mic, 0 phone line (GSM) recordings) - 981 Turns - Transliteration (VM II Format)
- Verbmobil - VM CD 63.0 - VM63.0 (Original-Edition)
German - 14 WOZ Dialoge zur Evozierung von Emotionen (hauptsächlich
Ärger) - transliteration, emotion labeling
- Verbmobil - VM CD 64.0 - VM64.0 (Original-Edition)
German - 13 WOZ Dialoge zur Evozierung von Emotionen (hauptsächlich
Ärger) - transliteration, emotion labeling
- Verbmobil - VM CD 65.0 - VM65.0 (Original-Edition)
German - 13 WOZ Dialoge zur Evozierung von Emotionen (hauptsächlich
Ärger) - transliteration, emotion labeling
- Verbmobil - VM Bonus CD -
VMBONUS (BAS-Edition)
Zusätzliches Material, das nicht in den
ueblichen VM volumes veröffentlicht wurde.
- Verbmobil - VM Lexikon
Database -
VMLEX (BAS-Edition)
Verbmobil Lexikon Database der Universität Bielefeld
Die Verbmobil Daten der BAS Edition
können auch nach Sprachgruppen zusammengefasst
bestellt werden, z.B.:
- Alle deutschen Dialoge
- Alle amerikanischen Dialoge
- etc.
Eine solche Zusammenfassung erleichtert oft die Weiterverarbeitung.
Fragen und Orders bitte an
Florian Schiel