Misschien vindt u dit ook interessant

Publication date

DOI

Document Type

Bachelor Thesis

Collections

Open Access logo

License

CC-BY-NC-ND

Abstract

Voor NH onderzoek ik welke features de beste classifiers opleveren. Hiervoor maak ik gebruik van PU Learning (Elkan & Noto, 2008). Daarnaast stel ik een manier voor om te beoordelen of lezers een gelezen artikel interessant vonden zonder het te vragen. Deze informatie kan vervolgens gebruikt worden om de classifier op te trainen. Het blijkt dat de beste features de eerste alinea en de volledige tekst van het artikel zijn. Verder is er met de voorgestelde interessemaat een kleine verbetering zichtbaar in de resultaten van het classificatie algoritme.

Keywords

Citation