Ujarlerit

Nu kan man søge ord i den grønlandske korpus

Oqaasileriffik offentliggør den grønlandske Korpus

Korpussøgning

Oqaasileriffiks korpus, som indeholder mere end 18 mio. ord er nu tilgængelig til søgning.

Korpus indholder blandt andet ord fra skønlitteratur, digte, aviser, hjemmesider, tidsskrifter og lovgivninger.

Korpus er udarbejdet således at der er primært grønlandske ord, der kan søges i korpus. Ord, sætninger, stammer, afledninger og endelser kan søges. Ud over det er det muligt at søge ved hjælp af ordets lingvistiske oplysninger.

I korpus står søgningsresultatet i midten med noget kontekst omkring.

Korpus kan anvendes af alle, der vil udforske det grønlandske sprog, såsom sprogforskere, lærere, journalister og alle andre, der er interesseret i grønlandske sprog.

Kort om korpusudviklingen

I 2014 modtog Oqaasileriffik en masse pdf-filer med gamle aviser fra Timarit.is. I slutningen af 2015 besatte Oqaasileriffik en projektleder for korpusudviklingen.

Korpusudviklingen blev startet med nogle af teksterne fra Timarit.is, hvor de første to år brugtes til at konvertere og korrektur af Atuagagdliutit (1952-1955) fra gammel retskrivning til det nye retskrivning med Oqaasileriffiks Kleischmidt-konverter. Derefter begyndte man at samle skønlitteratur, digte, aviser, tidsskrifter, hjemmesider og lovgivninger.

Søgningseksempler:

Undersøg hvor mange gange ordene ”kalaallisut” og ”oqaatsivut” blev skrevet ved siden af hinanden i samme sætning

Undersøg hvor mange gange stammene “kalaaleq” og “oqaaseq” blev skrevet ved siden af hinanden i samme sætning

Undersøg i grønlandske tekster, både i originale grønlandske tekster og i oversatte grønlandske tekster, hvor mange gange “aalianger” blev anvendt

Undersøg i grønlandske tekster, både i originale grønlandske tekster og i oversatte grønlandske tekster, hvor mange gange “aalajanger” blev anvendt

Undersøg hvilke ord består af dualisformem (totalsformen)

Undersøg hvilke ord består af afledningsformen “nikuu”

Der findes mange forskellige søgningsmuligheder, men 18 mio. ord i forhold til andre lande med korpora, er ikke så stort, derfor fortsætter korpusudviklingen og søgningsmulighederne vil også forbedres i fremtiden. 18 mio. ord.

Hvis du vil høre nærmere om korpus og korpusudviklingen er du velkommen til at kontakte den korpusansvarlige i Oqaasileriffik Minik Jeremiassen.

Email: minik@oqaasileriffik.gl

Oqarasuaat: +299 384067