Konventionslexikon zur Transliteration von Spontansprache

Susanne Burger


Institut für Phonetik und sprachliche Kommunikation
München

(Lexikon zum "Handbuch zur Datenaufnahme und Transliteration in TP14 von VERBMOBIL -3.0"
Kohler,Lex,Pätzold,Scheffers,Simpson,Thon
Kiel,September1994)
Eine Postscript-Version des Handbuchs ist am IPDS in Kiel erhältlich.

Same page in English


Inhalt

    1. Allgemeines zur Transliteration

      1.1 Interpunktion

      1.2 Filestruktur

    2. Symbole

    3. Literatur


NEU :


1. Allgemeines zur Transliteration:


1.1 Interpunktion

Punkt

Symbol: " . "

steht am Satzende zwischen Leerstellen

Beispiel:

... so , guten Tag , mein Name ist <!1 is'> J"ansch . 
    <"ah> wir hatten bereits telefoniert<Z> . ...

Anmerkung:

In Zweifelsfällen entscheidet, ob ein " . " gesetzt wird oder nicht:

  • Grammatik
  • Intonation
  • Pause, Atmen
  • Beginn eines neuen Gedankens
  • Fragezeichen

    Symbol: " ? "

    steht am Ende einer Frage zwischen Leerstellen

    Beispiel:

    ... <A> wie schaut 's denn aus , den darauffolgenden 
        Sonntag , den <:<#Mikrobe> neunundzwanzigsten:> 
        bei Ihnen ? geht 's da ? ...

    Anmerkung:

    In Zweifelsfällen entscheidet, ob ein " ? " gesetzt wird oder nicht:

  • Fragewörter
  • Satzbau
  • Intonation
  • Kontext
  • Komma

    Symbol: " , "

    steht zwischen Satzteilen oder Nebensätzen zwischen Leerstellen

    Beispiel:

    ... <"ahm> morgen , Freitag , <h"as> wie ich seh' , 
        <"ah> mu"s ich feststellen , da"s ich <"ah> 
        "uberhaupt keine Zeit hab' . ...   

    Anmerkung:

    In Zweifelsfällen entscheidet, ob ein " , " gesetzt wird oder nicht:

  • Grammatik
  • Nebensatz einleitende Partikel
  • Intonation
  • zusammengehörende Gedanken
  • z.B.:

    a) ich k"onnte schon , mittwochs hab' ich immer 
       Zeit .
    b) ich k"onnte schon . <P> <A> mittwochs hab' ich 
       immer Zeit .

    vor Leerstelle und Interpunktionszeichen darf stehen:


    1.2 Filestruktur:


    2. Symbole:


    Zu den Lexikoneinträgen:


    Buchstabieren:

    Beispiel:

    ... mein Name ist J<Z>"ansch , $J $"A $N $S $C $H ...

    Symbol: $

    Jeder buchstabierte Buchstabe wird groß geschrieben,
    $ wird vorangestellt.

    vor $ darf stehen:

    (
    +/
    -
    Leerstelle


    Nichtwörter:

    Beispiel:

    ... *haarknapp <:<#Rascheln> um einen <!1 ein'> Tag 
        verfehlt ... 
    ... was *exkursieren Sie denn ? ...

    Symbol: *

    Als Nichtwort gelten:

  • Neuschöpfungen,
  • Versprecher,
  • fremdsprachliche Wörter, die im Duden nicht aufgenommen sind,
  • ausländische Namen.
  • Dem Nichtwort wird * ohne Leerstelle vorangestellt.

    vor * darf stehen:

    (
    +/
    <;T>
    Leerstelle


    Häsitationen:

    Beispiel:

    ... <"ah> wir hatten bereits telefoniert<Z> ...
    ... gu<Z>t , <"ahm> wie w"ar' es bei Ihnen am<Z> 
        neunzehnten Juli ...
    ... ich denke/- <hm> also bei mir ginge es sehr 
        gut ...
    ... w"urd' ich sagen , <A> <h"as> wenn wir ...

    Symbol: <"ah> <"ahm> <hm> <h"as>

    Häsitationen stehen zwischen <>

  • <"ah>: rein vokalische Artikulation, unabhängig von der Vokalqualität
  • <"ahm>: vokalische Artikulation + nasale Artikulation
  • <hm>: rein nasale Artikulation
  • <h"as>: seltenere Artikulationen, die nicht in eine der ersten drei Klassen einzuordnen sind.
    Hierunter fallen z.B. /brrt/ /pf /puh/ etc.
  • vor <h"as> .. darf stehen:

    (
    <;T>
    Leerstelle


    Artikulatorische Geräusche:

    Beispiel:

    ... Mittagessen <P> <Schmatzen> und<Z> , na ja ...
    ... ordentlich planen mu"s und <"ah> <Schlucken> wann 
        w"urde Ihnen ...
    ... einverstanden . <P> <R"auspern> auf 
        Wiedersehen ...
    ... +/je/+ <Husten> je schneller wir das machen ...
    ... bei <:<Lachen> mir:> terminlich sehr 
        ung"unstig ... 
    ... dann/- <"ah> <A> <Ger"ausch> das sind sechs 
        Termine ...

    Symbol: <Schmatzen> <Schlucken> <R"auspern> <Husten> <Lachen> <Ger"ausch>

    <Ger"ausch> steht für nicht-zuordenbare Produktionen.
    Artikulatorische Geräusche werden zum Zeitpunkt ihrer Produktion
    zwischen Leerstellen transliteriert.
    Sie können auch andere verbale und nonverbale Produktionen überlagern.

    vor <Ger"ausch> .. darf stehen:

    (
    <:
    Leerstelle


    Zögerung/Dehnung:

    Beispiel:

    ... ich h"atte Zeit +/am<Z>/+ <A> <Schmatzen> ab 
        Dienstag ...
    ... ich dachte ger<Z>ade ...

    Symbol: <Z>

    <Z> wird ohne Leerstelle an den gedehnten Laut angehängt, unahängig davon, an welcher Stelle des Wortes die Dehnung zu hören ist.

    vor <Z> darf stehen:

    Kleinbuchstabe
    Großbuchstabe


    Atmen:

    Beispiel:

    ... ist G<Z>"urtner , <A> <"ahm> $G $"U $R $T $N 
        $E $R <A> . <A> ...

    Symbol: <A>

    <A> steht hauptsächlich für Einatmen und deshalb hinter dem Interpunktionszeichen.
    Bei deutlichem Ausatmen am Ende eines Satzteils kann Atmen auch vor einem Interpunktionszeichen stehen.

    vor <A> darf stehen:

    (
    Leerstelle


    Pausen:

    Beispiel:

    ... ich habe <P> M"oglichkeiten dazu ...

    Symbol: <P>

    An Satz-/Satzteilgrenzen steht <P> immer nach dem Interpunktionszeichen.

    vor <P> darf stehen:

    (
    Leerstelle


    Wortunterbrechung:

    Beispiel:

    ... Ver_ <A> _pflichtungen ... 
    ... statt_ +/f=/+ <h"as> _findet ...

    Symbol: _

    Wird ein Wort unterbrochen und nach der Unterbrechung fortgesetzt, so steht nach der Abbruchstelle _ ohne Leerstelle und vor der Fortsetzungsstelle _ ohne nachfolgende Leerstelle. Alle während der Unterbrechung stattfindenden Ereignisse werden getrennt durch Leerstellen zwischen den Wortteilen notiert.

    vor li_blank (linkes subline) darf stehen:

    -
    <Z>
    Großbuchstabe
    Kleinbuchstabe

    vor blank_re (rechtes subline) darf stehen:

    Leerstelle


    Wortabbruch:

    Beispiel:

    ... +/sieb=/+ siebzehnter ... 
    ... im Ja=/- also ich sag' Ihnen jetzt ...

    Symbol: =

    An ein abgebrochenes Wort wird = ohne Leerstelle angehängt.

    vor = darf stehen:

    <Z>
    Großbuchstabe
    Kleinbuchstabe


    Phrasenabbruch:

    Beispiel:

    ... ab dem dritten August <A> bis zum/- <P> Moment , 
        ich ... 
    ... ja , ich hab' da eigentlich/- also ich bin vom 
        neunzehnten bis ...

    Symbol: /-

    Ein Abbruch liegt dann vor, wenn der Sprechakt angehalten und nach dem Abbruch ein neuer Gedankengang begonnen wird. An der Abbruchstelle wird /- ohne Leerstelle angefügt. Hinter /- stehen keine Interpunktionszeichen.

    vor /- darf stehen:

    =
    <A> (nur bei Ausatmen)
    <Z>
    <;T>
    Großbuchstabe
    Kleinbuchstabe


    Wiederaufnahme:

    Beispiel:

    .... +/am/+ <:<#Mikrobe> am Donnerstag:> kann ich 
        erst ... 
    ... +/im Sep=/+ im September ... 
    ... die Woche +/von/+ <"ah> mit Freitag ... 
    ... also +/das/+ das/+ das zweite ...

    Symbol: +/../+

    Bei einer Wiederaufnahme wird nach der Unterbrechungsstelle das vorher Abgebrochene entweder wiederholt oder korrigiert. An der Unterbrechungsstelle wird /+ ohne Leerstelle angefügt. Der Äußerung, die nach der Unterbrechungsstelle dann wiederholt/korrigiert wird, wird +/ ohne nachfolgende Leerstelle vorangestellt, sodaß +/.. /+ das Reparandum klammert.

    vor +/ darf stehen:

    (
    Leerstelle

    vor /+ darf stehen:

    =
    <A> (nur bei Ausatmen)
    <Z>
    <;T>
    Großbuchstabe
    Kleinbuchstabe


    Schwerverständliches:

    Beispiel:

    ... %eins , %zwei , %drei , %vier ... 
    ... wann h"atten Sie %da bitte Zeit ...

    Symbol: %

    Vor schwerverständlichen Wörtern steht % ohne Leerstelle.

    vor % darf stehen:

    (
    +/
    <;T>
    Leerstelle


    Unverständliches:

    Beispiel:

    ... aber <A> <"ah> <%> <"ahm> wie w"ar's denn ... 
    ... <%> fr"uher geht 's leider nicht ...

    Symbol: <%>

    Für Unverständliches steht <%> zwischen Leerstellen.

    vor <%> darf stehen:

    (
    Leerstelle


    Kommentare:

    Beispiel:

    ; Tonqualit"at: viele Nebenger"ausche ... 
    ;gesamter Turn verrauscht ...
    ... zum Beispiel <;"ubersteuert> ... 
    ... einen Termin vereinbaren <;heiser> ...

    Symbol: ;

    Ein den ganzen Dialog betreffender Kommentar steht vor dem gesamten Dialog im Header, am Zeilenanfang steht ein Semikolon, nach dem Kommentar folgt eine Leerzeile. Ein Kommentar zu einem Beitrag eines Sprechers wird am Zeilenanfang mit Semikolon eingeleitet und ohne Leerzeile an den Sprecherbeitrag angefügt.

    Symbol: <;..>

    Lokale Kommentare werden im Text hinter der relevanten Stelle und einer Leerstelle eingefügt, durch ein Semikolon eingeleitet und in spitze Klammern eingeschlossen.

    vor <;..> darf stehen:

    Leerstelle


    Technischer Abbruch:

    Beispiel:

    ... ab ein U<;T> ... 
    ... <;T>neunzehnten is<Z>t etwas schwierig ... 
    ... erste Woche ginge <A> <;T> <#Klicken> <A> 
        <"ah> Montag ... 
    ... unsere Termine alle untergebra<;T> <;T>ke ...

    Symbol: <;T>

    Durch den Knopfdruck kann die Sprachaufnahme am Anfang oder am Ende abgeschnitten werden, aber auch innerhalb eines Dialogbeitrags unterbrochen sein.
    Fand der Abbruch während einer lexikalischen Einheit statt, wird <;T> ohne Leerstelle davor oder danach angehängt. Zwischen zwei aufeinanderfolgenden <;T> steht eine Leerstelle.
    Wurde keine lexikalische Einheit abgeschnitten, steht <;T> zwischen Leerstellen.

    vor <;T> darf stehen:

    <:        
    +/
    <h"as>..
    <Z>
    Großbuchstabe
    Kleinbuchstabe
    Leerstelle


    Aussprachevarianten:

    Beispiel:

    ... damit w"ar' das <!1 des> eigentlich klar ... 
    ... dann kommen Sie <!2 komm' Se> doch ... 
    ... wenn wir <!2 wemma> 's die Woche noch machen ... 

    Symbol: <!n ..>

    Dialektaussprachen, andere Stilformen oder sonstige Abweichungen werden in korrekter Form nach Duden verschriftet. Die eigentlich geäußerte Version wird hinter der korrekten Form
    nach einer Leerstelle
    in spitzen Klammern ,
    nach einem ! ,
    einer Ziffer, die sich auf die betroffenen lexikalischen Einheiten bezieht,
    und einer Leerstelle transliteriert.

    Hinweis: Genauer definierte Regeln zur konsistenteren Verschriftung von Aussprachekommentaren finden sich im Verbmobil-Memo 111: Aussprachevarianten in der VERBMOBIL-Transliteration - Regeln zur konsistenteren Verschriftung (Burger, Kachelrieß, München, August 1996).

    vor <!n ..> darf stehen:

    Leerstelle


    nichtartikulatorische Geräusche:

    Beispiel:

    .. de<Z>m <:<#Klicken> neunundzwanzigsten:> 
        August ... 
    ... <:<#Klingeln> am Mittwoch st"anden:> ...
    ... <:<#Klopfen> gern so machen:> ... 
    ... <#Mikrobe> das tut mir leid ... 
    ... ich k"onnte Ihnen <:<#Mikrowind> vorschlagen:> ... 
    ... nach Berlin <P> ausmachen . <#Rascheln> <"ahm> ... 
    ... der gesamte <:<#Quietschen> Rest des Mais:> ... 
    ... k"ame mir gelegen , <A> <#> allerdings ...

    Symbol: <#Klicken> <#Klingeln> <#Klopfen> <#Mikrobe> <#Mikrowind> <#Rascheln> <#Quietschen> <#>

    <#Klicken> für z.B. Klicken des Knopfdrucks
    <#Klingeln> Telefonklingeln
    <#Klopfen> z.B. Tischberührung
    <#Mikrobe> Mikrofonberührung
    <#Mikrowind> ins Mikrofon blasen oder ins Mikrofon atmen
    <#Rascheln> z.B. Papierrascheln
    <#Quietschen> z.B. Stuhlquietschen
    <#> Geräusche, die in keine der anderen Kategorien passen

    Nichtartikulatorische Geräusche werden durch vorangestelltes # in spitzen Klammern
    verschriftet.
    Sie können auch andere verbale Produktionen oder nichtartikulatorische Geräusche überlagern.

    vor <#>.. darf stehen:

    (
    <:
    Leerstelle


    Geräuschüberlagerung:

    Beispiel:

    ... de<Z>m <:<#Klicken> neunundzwanzigsten:> 
        August ... 
    ... bei <:<Lachen> mir:> terminlich sehr 
        ung"unstig ... 
    ... <:<#Klopfen> <Lachen> k"amen mir die Monate:> 
        April ... 
    ... <:<Lachen> ich habe:> <:<#Klopfen> <Lachen> 
        heute:> keine Zeit ... 

    Symbol: <:..:>

    Nichtartikulatorische Geräusche oder nonverbale artikulatorische Produktionen,
    die Wörter oder andere Ereignisse überlagern, werden zusammen mit den Wörtern/Ereignissen mit <: :> geklammert.
    Nach <: folgt das überlagernde Geräusch, eine Leerstelle und die
    überlagerte Produktion. :> schließt die Klammerung und wird nach dem
    Überlagerten ohne Leerstelle gesetzt.
    Bei mehreren überlagernden Ereignissen gilt folgende Reihenfolge:
    - nichtartikulatorische Geräusche,
    - artikulatorische nonverbale Produktionen,
    - verbale Produktionen.

    vor <: darf stehen:

    (
    Leerstelle

    vor :> darf stehen:

    /+
    /-
    -
    <.. >
    <#.. >
    <h"as>
    <A>
    <Z>
    <%>
    <;T>
    Großbuchstabe
    Kleinbuchstabe


    Überlappendes Sprechen (nur bei Dialogen ohne Knopfdruck):

    Beispiel:

    PEG004: wollen wir mal die Termine ausmachen , 
            (f"ur die n"achsten@)  Monate ?
    CLK005: (@ja gerne).. gerne.
    CLK087: nee , nicht den elften , den<Z> 
            (f"unfzehnten <A>@)..
    PEG088: (@f"unfzehnten) und den 
            (achtundzwanzigsten@)..
    CLK089: (@genau <A>)..
    HAH008: nein , da mu"s ich zu einem (Besuch@) nach 
            (Leipzig@)..
    TIS009: (@m).. (@aha)..
    HAH008: nein, da mu"s ich zu einem (Besuch@) nach 
            Leipzig..
    TIS009: (@m , aha)..

    vor ( bzw. (@ darf stehen:

    Leerstelle

    vor ) bzw. @) darf stehen:

    :>
    /+
    /-
    <Ger"ausch>..
    <#>..
    <h"as>
    <A>
    <P>
    <Z>
    <%>
    <;T>
    Großbuchstabe
    Kleinbuchstabe
    


    3. Literatur:

    K.Kohler , G.Lex , M.Pätzold , M.Scheffers , A.Simpson, W.Thon: Handbuch zur Datenaufnahme und Transliteration in TP14 von VERBMOBIL -3.0 , Verbmobil-Report, Nr. 11 , September 1994.

    A. Batliner, S. Burger, A. Kießling: Außergrammatische Phänomene in der Spontansprache: Gegenstandsbereich, Beschreibung, Merkmalinventar, Verbmobil-Report, Nr. 57, Februar 1994.

    S.Burger, E.Kachelrieß: Aussprachevarianten in der VERBMOBIL-Transliteration - Regeln zur konsistenteren Verschriftung, Verbmobil-Memo, Nr. 111, August 1996.


    The VERBMOBIL Project August 1995


    Copyright © 1995 Institut für Phonetik und Sprachliche Kommunikation, Universität Müchen
    Diese und alle weiteren hier referenzierten Seiten, welche von diesem WWW Server stammen, dürfen kopiert, gedruckt und an Dritte weitergegeben werden, unter der Bedingung, daß jede Seite vollständig bleibt. Weitergabe von Auszügen nur mit Erlaubnis des Urhebers.


    Susanne Burger burger@phonetik.uni-muenchen.de