Oproep voor vrijwilligers inzake corpus BasiScript

Aan de Radboud Universiteit wordt momenteel een corpus gebouwd van teksten die basisschoolleerlingen van groep 4 t/m 8 schrijven: BasiScript. Er worden tussen de 6 en 8 miljoen woorden verzameld over een periode van 3,5 jaar, van ca. 7000 leerlingen uit heel Nederland. De handgeschreven teksten worden gescand; dan overgetypt met codes voor doorhalingen, verbeteringen e.d; vervolgens wordt er een correct gespelde versie van gemaakt en worden de woorden voorzien van labels voor woordsoort, woordlengte, woordfrequentie en andere linguIstische gegevens.
Het corpus komt  ter beschikking van alle Nederlandse onderzoekers maar ook van mensen die school- en toetsmaterialen maken.

Voor dit project zoeken wij vrijwilligers die de met fouten-en-al overgetypte versie nakijken, dwz of die klopt met de gescande versie. Dit werk kan op elke tijd en plaats gedaan worden, mits men een computer met internetverbinding heeft. Scans en getypte versies staan op een webapplicatie waarop men met gebruikersnaam en wachtwoord inlogt. Men kan zoveel of zo weinig teksten nakijken als men maar wil. De onderzoekers zijn met alles blij! Het project loopt nog tot eind 2015. De teksten zijn meestal erg leuk of ontroerend, en altijd weer anders.

Wij benaderen (oud)docenten Nederlands omdat zij vaak gewend zijn leerlinghandschriften te ontcijferen. Bovendien weten zij beter dan anderen wat plausibele en niet-plausibele spelfouten bij kinderen zijn. Als een leerling bijvoorbeeld "bakker" bedoelt te schrijven, maar zijn schrijfletter  b lijkt erg op een l, dan geven we die leerling het voordeel van de twijfel en denken dat hij/zij een b (bakker)heeft geschreven en niet een l (lakker).
Iemand die geen kennis heeft van spelling en spelfouten zou in zo'n geval waarschijnlijk 'lakker' overtypen en dus het kind/de tekst geen recht doen.

Heeft u interesse? Stuur dan een email naar a.tellings@ru.nl (Dr. Agnes Tellings)voor meer informatie.