Sammendrag

Tutorial

Søk i syntaktiske strukturer i NorGramBank

Denne tutorialen er et kort innføringskurs som gir deg de kunnskapene og ferdighetene du trenger for å søke i NorGramBank. NorGramBank er en ny trebank (et syntaktisk analysert korpus) for bokmål og nynorsk. Omfattende trebanker som denne gjør det mulig å skaffe seg oversikt over den syntaktiske og leksikalske tilstanden i skriftspråket på en ny måte, til nytte for eksempel i syntaktisk hypotesetesting, språkhistorisk forskning, ordboksarbeid, språknormering og språkundervisning.

NorGramBank er på omkring 70 mill ord, og omfatter blant annet avistekst, sakprosa, barnebøker, romaner og stortingsforhandlinger. Trebanken er utviklet innenfor infrastrukturprosjektet INESS, som også har samlet trebanker for en lang rekke andre språk i en felles infrastruktur.

Den syntaktiske analysen i NorGramBank er utført automatisk ved hjelp av NorGram, en omfattende komputasjonell grammatikk for bokmål og nynorsk som tilordner setninger detaljerte analyser innenfor rammeverket leksikalsk-funksjonell grammatikk (LFG).

Det er utviklet et effektivt og konsist søkespråk, INESS Search, som gjør det mulig å søke etter eksempler i NorGramBank, såvel som i andre INESS-trebanker, og sortere dem etter detaljerte syntaktiske og grammatiske kriterier. For å kunne benytte denne ressursen trenger man derfor en viss innsikt i søkespråket og i innretningen av de grammatiske analysene.

Dette innføringskurset gir både en slik grunnleggende innsikt og praktiske ferdigheter. Først gis en innføring i den grammatiske analysen, dernest en innføring i søkespråket og en gjennomgang av noe av dokumentasjonen som finnes, og så vil deltagerne få anledning til å søke, under veiledning, etter språklige fenomener de er interessert i.

Deltagere som på forhånd vet hva slags fenomener de er særlig interessert i å søke etter, inviteres til å sende opplysninger om dette til iness@uib.no.