corpus
Betekenis corpus
Een corpus is een verzameling teksten die dient als dataset voor taalkundig onderzoek of andere vormen van tekstuele analyse.
Woordsoort
zelfstandig naamwoord
Voorbeeldzin met corpus
Het taalkundig onderzoeksproject maakte gebruik van een omvangrijk corpus van moderne Nederlandse literatuur.
Uitspraak (fonetisch)
/ˈkɔr.pɵs/ (Wat is het fonetisch alfabet?)
Afbreekpatroon: cor-pus
Synoniemen
- tekstverzameling
- documentatie
- tekstbestand
Woorden die beginnen of eindigen met "corpus"
- corpora
- corpuswoordenboek
- corpusstudie
Etymologie
Het woord 'corpus' komt uit het Latijn, waar het 'lichaam' betekent, en werd later in het Engels en Nederlands overgenomen als term voor een verzameling teksten.
Veelgestelde vragen
- Wat is het verschil tussen een corpus en een tekst?
Een corpus is een verzameling van teksten, vaak samengesteld voor een specifiek doel of onderzoek, terwijl een tekst een enkele geschreven of gesproken creatie kan zijn. - Waarvoor wordt een corpus gebruikt?
Corpora worden vaak gebruikt in taalkundig onderzoek, machine learning, en kunstmatige intelligentie om patronen en structuren in taal te analyseren. - Hoe maakt men een corpus?
Een corpus wordt samengesteld door teksten te verzamelen die representatief zijn voor het onderzochte onderwerp. Dit kan handmatig of via geautomatiseerde processen gebeuren. - Kunnen corpora in elke taal bestaan?
Ja, corpora kunnen in elke taal bestaan en worden vaak specifiek samengesteld voor onderzoek naar die taal. - Wat is een meerhoud van 'corpus'?
De meervoudsvorm van 'corpus' is 'corpora'.