Tools f"ur die Endkorrektur:
(Burger, 26.06.98)

Aufrufe, seds

Zum Teil m"ussen die Pfade und Filenamen noch entsprechend ausgef"ullt werden.
Immer aufpassen mit Kopie-DIRs!!
Vorsicht, vielleicht habe ich mich manchmal vertippt!!


-----------------------------------------------------------------
Checken:

Aufruf:
% foreach m (*.trl)
% echo $m
% cat $m | /data/data16/vmII_data/3VMII_PARS/PARSER/./trlcheck | grep 'error'
% end

------------------------------------------------------------------
alte Ger"auschkategorien ersetzen:

Aufruf:
% mkdir neuger

Aufruf:
% foreach (*.trl)
% sed -f /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/altger2neuger.sed $m > neuger/${m}
% end


altger2neuger.sed
...............................
s/<#Mikrobe>/<#Klopfen>/g
s/<#Mikrowind>/<#Rascheln>/g
s/<#Klicken>/<#Klopfen>/g
s/<#Klingeln>/<#Quietschen>/g
...............................

Wortliste VM-TRL:

Aufruf:
% foreach m ( *.trl )
% /data/data16/vmII_data/3VMII_PARS/FILTER/./trlparse --file $m --w --awortdef | sed -f /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/list.sed >> allcdneu
% end

Aufruf:
%tr " " "\n" < allcdneu | sort | uniq -c | awk '{printf("%s %s\n", $2, $1)}' | awk '/Flags-value/ {next} $1 !~ /[,\.\?0-9:]/ {print $1}' > listneu

Aufruf:
% diff /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/woli_bis_CDxx(alt) listneu | egrep "^>" > restneu

------------------------------------------------------------------

Wortliste Sampa-Aussprache:

Aufruf:
% foreach m ( *.trl )
% echo $m
% /data/data16/vmII_data/3VMII_PARS/FILTER/./trlparse --file $m --w --awortdef | sed -f /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/samlist.sed >> samall
% end
Aufruf:

%tr " " "\n" < allcdneu | sort | uniq -c | awk '{printf("%s %s\n", $2, $1)}' | awk '/Flags-value/ {next} $1 !~ /[,\.\?0-9:]/ {print $1}' > listneu

Aufruf:
% diff /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/woli_bis_CDxx(alt) listneu | egrep "^>" > restneu

-------------------------------------------------------------------

sed f"ur Wortlisten:

list.sed:
......................
s#  # #g
s#_ _##g
......................

samlist.sed
..........
s#  # #g
..........
distagg.sed
..........
s/*//g
s/~//g
s/%//g
s/<_T>//g
s/<T_>//g
s/_//g
s/=//g
s/\(#\)\([a-zA-Z]\+\)-\([a-zA-Z]\+\)/\1\2\3/g
s/\(#\)\([a-zA-Z]\+\)-\([a-zA-Z]\+\)/\1\2\3/g
s/#//g
............
--------------------------------------------------------------------
Parallelvergleich close/raum/tele trl:

Aufruf:
% foreach m (*.trl)
% /data/data16/vmII_data/3VMII_PARS/FILTER/./trlparse --file $m -wdscgpmki > ${m}flt
% end

Aufruf:                                                
% foreach m (*.trlflt)
% tr " " "\n" < $m > ${m}1
% end

Aufruf:
% diff gxxxac.trlflt1 gxxxat.trlflt1 | egrep "^>"
Aufruf:
% diff gxxxat.trlflt1 gxxxac.trlflt1 | egrep "^>"

Aufruf:
% diff gxxxac.trlflt1 gxxxar.trlflt1 | egrep "^>"
Aufruf:
% diff gxxxar.trlflt1 gxxxac.trlflt1 | egrep "^>"

--------------------------------------------------------------------
neue Wortliste:

Aufruf:
cat woli_bis_CD(alt) listxx | sort | uniq -c | awk '{print $2}' > woli_bis_CDxx

--------------------------------------------------------------------

TurnIDs checken:
(*.mar und *.trl in einem Dir!)

Aufruf:
% foreach m (g*)
% echo $m
% /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/./mar_trl_check ${m:r}
% end

Aufruf:
% foreach m (g*)
% echo $m
% /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/./mar_trl_vergl ${m:r} | grep "nicht"
% end

--------------------------------------------------------------------
CD-Namen/formatieren:

editierfehler raus:

Aufruf:
% egrep "^[^;g ][^0-9]" *.trl

~~~~~~~~~~
CD-Namen einf"ugen:

(Vorsicht: schreibt in ein Sub-Direct. Filename ohne extension)

Aufruf:
% mkdir form 

Aufruf:
% foreach m (*.trl)
% sed -f /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/CDR-Nr.sed $m > form/${m:r}
% end

.............................................
CDR-Nr.sed:
s/; CDR:/; CDR: xx.00/g
s/; TRV: 01/; TRV:/g
s/; TRV:/; TRV: xx.00/g
s/_000000:/_xx0000:/g
s/.00 /.00/g
s/; CDR: xx.00xx.00/; CDR: xx.00/g
..............................................

~~~~~~~~~~~~
formatieren:
(Vorsicht: benutzt Files ohne extension aus dem Sub--Direct im Sub-Direct. 
 jetzt wieder mit extension)

Aufruf:
% foreach m (form/*)
% awk -f /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/trl_one_line.awk $m | awk -f  /data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/trl_umbruch.awk > format/${m}.trl
% end

------------------------------------------------------------------

segmentierte Files anh"oren:

Aufruf:
% chkvolvmII CD=Pfad_wo_die_Datendirs_liegen TRL=Pfad_wo_die_TRLs_liegen lf=[filename]_log signalDIRname [filename_mar_ohne_extension]

Beispiel:
% chkvolvmII CD=/data/data20/cd3vmII/data TRL=/data/data16/vmII_data/4VMII_FERTIG/End_korr_Tools/CD21/ lf=cd203t_log g203a g203at
...................

genau "uberpr"ufen (visuell):

(Zulaessige Typen: nist_16 nist_al wav al raw_s16)

Aufruf:
% vmturnview nist_al sigkanal1.al sigkanal2.al

oder

Aufruf:
% vmturnview nist_16 sigkanal1.16 sigkanal2.16

------------------------------------------------------------------

sprecher"uberlagerungs Checkprogramm:
(trotzdem mit xemacs anschauen!)

Aufruf:
% chksup source=Pfad_wo_die_TRLs_stehen

Beispiel:
% chksup source=CDneu

------------------------------------------------------------------
*.rpr/*.spr/NIST-header Sprecherk"urzel vergleichen:

(Scripte vom Karl!)
Werden noch geliefert (26.06.98)



