AUTOMATISCHE SPRAAKHERKENNING VOOR INFANT DIRECTED SPEECH
Publication date
Authors
DOI
Document Type
Bachelor Thesis
Metadata
Show full item recordCollections
License
CC-BY-NC-ND
Abstract
In dit onderzoek worden drie benaderingen onderzocht om een aanbeveling te doen voor een methode om een automatische spraakherkenning (automatic speech recognition, ASR) voor de manier van praten tegen kinderen. De eerste benadering kijkt naar hoe eerdere ASR gemaakt zijn voor nieuwe talen. Als tweede wordt er gekeken naar hoe er ASR is gemaakt voor dialecten en als derde wordt er gekeken naar de zeroresource methode. De aanbeveling is om twee benaderingen te combineren en met behulp van Kaldi (Povey et al., 2011), SpecAugment (Park et al., 2019) en Sequitur (Bisani & Ney, 2008) een ASR te maken met MFCC (Zheng et al., 2001). Verder moeten alle data die er zijn, worden gebruikt, aangevuld met grafeem naar foneem regels en een lexicon met uitzonderingen.
Keywords
Automatische spraakherkenning, babypraat, infant directed speech, Kaldi, SpecAugment,
Sequitur