Lexical and Acoustic Modelling of Swedish Prosody

Sammanfattning: Popular Abstract in Swedish Prosodi och intonation är viktiga delar i det mänskliga talet. I system för text-till-talomvandling och automatisk taligenkänning måste prosodiska modeller inkluderas för att uppnå acceptabla resultat. Denna avhandling bidrar till modelleringen av svensk prosodi ur lexikalt och akustiskt perspektiv. Tre aspekter av lexikal modellering av prosodi studeras. Vi skisserar en modell av prosodibehandlingen för 'icke-standard'-ord, samt genomför en analys av ordbetoning i svenska. I en större studie byggs ett CART-baserat system för förutsägelse av uttal från ortografi. Genom förutsägelse bokstav-för-bokstav förutsägs allofoner korrekt till 98.87% och hela ord korrekt till 72.26%. För prosodi uppnås de bästa resultaten genom förutsägelser från hela ordmönster: huvudbetoningens position är korrekt i 88.6% och ordaccenten i 87.7% av fallen. I den akustiska delen presenteras först två översikter: en om tidigare arbeten inom talteknologiinriktad modellering av svenskans intonation, samt en om intonationsmodeller i allmänhet, med tonvikt på stiliseringsmodeller. Vårt eget bidrag utgörs av utvecklandet av ett system som genererar grundtonskurvor utifrån prosodiska transkriptioner. Den sista studien handlar om automatisk identifiering och klassificering av dialekttyp, ordaccentkategori och prominensnivå i svenskan. Material från nästan 100 olika dialekter och 250 talare används. Genom parametrisering av grundtonskurvor, bl a genom stiliseringsmodeller, byggs modeller för förutsägelse av ovan nämnda kategorier. De bästa resultaten är 79.3% för ordaccent, 62.2% för prominensnivå, samt 59.1% för dialekttyp. För enskilda orter, kan ordaccentkategori klassificeras korrekt i upp till över 90% av fallen.

  Denna avhandling är EVENTUELLT nedladdningsbar som PDF. Kolla denna länk för att se om den går att ladda ner.