Automatische toekenning werkwoordstijden

Publication date

DOI

Document Type

Bachelor Thesis

Collections

Open Access logo

License

CC-BY-NC-ND

Abstract

In dit onderzoek is onderzocht of het mogelijk is om automatisch werkwoordstijden toe te kennen aan werkwoordscombinaties uit datasets. Er zijn vijf talen onderzocht: Nederlands, Spaans, Engels, Frans en Duits. De nadruk lag echter op Nederlands en Spaans. Er is onderzocht of een beslisboom kon worden getraind op een dataset en vervolgens worden gevalideerd op een andere dataset. Een handmatig opgesteld regelgebaseerd algoritme is gebruikt als basislijn voor het Nederlands en het Spaans. Uit de resultaten is gebleken dat voor het Nederlands een percentage kon worden behaald van boven de 90 procent, voor het Spaans rond de 70 procent. Het algoritme behaalde slechtere resultaten dan het regelgebaseerde algoritme voor beide talen.

Keywords

Citation