Olov Engwall, docent på Centrum för talteknologi/Institutionen för tal, musik och hörsel, Kungliga tekniska högskolan, talar om "Audiovisuell-till-artikulatorisk inversion".

Tid och plats: Onsdagen den 2 december 2009, kl 16:00-17:30 i Övningslaboratoriet, hus C plan 2.

Sammanfattning

Artikulatorisk inversion innebär att försöka rekonstruera talrörets utseende (d.v.s. hur käken, tungan, läpparna etc. var placerade och formade) när ett visst ljud eller ord yttrades. Om det lyckas skulle det vara viktigt både för vår teoretiska fonetiska kunskap och för tillämpningar som automatisk återkoppling i uttalsträning, taligenkänning och talkodning. Sambandet mellan ljud och artikulation är dock inte entydigt och samma ljud kan skapas på flera olika sätt. För att ändå försöka identifiera den rätta artikulationen kan man ta ytterligare information till hjälp, exempelvis videobilder av talarens ansikte.

Jag kommer att beskriva hur vi använt inspelningar med ljud, video, markörföljning ("motion caputre") och artikulografi för att statistiskt kartlägga sambandet mellan ljud och artikulation. Jag kommer att ta upp frågor som vilka ljud-artikulationssamband som är mer eller mindre entydiga, hur visuell information om talarens ansikte kan förbättra uppskattningen, hur valet av statistisk metod påverkar resultaten och hur man mäter om inversionen var lyckosam eller inte.