AUTOMATISCHE SPRAAKHERKENNING VOOR INFANT DIRECTED SPEECH

Publication date

DOI

Document Type

Bachelor Thesis

Collections

Open Access logo

License

CC-BY-NC-ND

Abstract

In dit onderzoek worden drie benaderingen onderzocht om een aanbeveling te doen voor een methode om een automatische spraakherkenning (automatic speech recognition, ASR) voor de manier van praten tegen kinderen. De eerste benadering kijkt naar hoe eerdere ASR gemaakt zijn voor nieuwe talen. Als tweede wordt er gekeken naar hoe er ASR is gemaakt voor dialecten en als derde wordt er gekeken naar de zeroresource methode. De aanbeveling is om twee benaderingen te combineren en met behulp van Kaldi (Povey et al., 2011), SpecAugment (Park et al., 2019) en Sequitur (Bisani & Ney, 2008) een ASR te maken met MFCC (Zheng et al., 2001). Verder moeten alle data die er zijn, worden gebruikt, aangevuld met grafeem naar foneem regels en een lexicon met uitzonderingen.

Keywords

Automatische spraakherkenning, babypraat, infant directed speech, Kaldi, SpecAugment, Sequitur

Citation