sto

Forskningsadjunkt Stig Jørgensen (tv) og forskningsassistenterne Jette Drost og Carsten Hansen - alle fra Institut for Datalingvistik - er HHKs samarbejdspartnere med Center for Sprogteknologi om udviklingen af dansk sprogteknologisk orddatabase.

Millionbevilling til dansk sprogteknologi

En bevilling på 7,4 millioner kroner fra IT- og Forskningsministeriet er en saltvandsindsprøjtning til arbejdet med at sikre det danske sprogs rolle i netværkssamfundet

Af Mette Boas
Foto: Jørn Albertus

Modtageren af en 7,4 millioner stor bevilling fra IT- og Forskningsministeriet er sektorforskningsinstitutionen Center for Sprogteknologi. Centret skal i samarbejde med Institut for Almen og Anvendt Sprogvidenskab, Københavns Universitet, Institut for Erhvervsinformatik, Syddansk Universitet og Institut for Datalingvistik på Handelshøjskolen i København udarbejde en sprogteknologisk orddatabase for det danske sprog.

Denne orddatabase skal blive et basisprodukt, som skal danne grundlaget for udvikling af en lang række IT- værktøjer - heriblandt oversættelsesværktøjer, grammatikkontroller og intelligente søgeværktøjer i forbindelse med søgning på Internettet.

Flere erhvervssproglige jobs

- Denne database vil komme til at spille en stor rolle erhvervsmæssigt, fordi der så kan blive udarbejdet produkter, der ikke var mulighed for - og ressourcer til - før. Vi laver ressourcen, hvorefter det er op til forskning og erhvervsliv, hvad den skal bruges til, siger forskningsadjunkt Stig Jørgensen, der er projektleder for Handelshøjskolens andel af projektet.

På Institut for Datalingvistik er der i alt tre medarbejdere, der arbejder med projektet. De to andre er forskningsassistenterne Jette Drost og Carsten Hansen.

- Det færdige resultat ville nok ikke se meget andeledes ud, hvis Handelshøjskolen i København ikke deltog. Men alligevel mener jeg, at det er meget vigtigt, at vi er med i et projekt som dette, da det kommer til at have en positiv betydning for erhvervssprogligt uddannedes beskæftigelsesmuligheder på både kort og lang sigt. Sprogteknologi hæmmer ikke beskæftigelsen, tværtimod, slår Stig Jørgensen fast.

Netværkssamfund for alle

Der er stor enighed om, at alle danskere har krav på at kunne deltage i fremtiden på deres eget modersmål. Den orddatabase, som projektet har til opgave at etablere, vil forbedre mulighederne for det.

Forskningspolitisk er det derfor meget vigtigt at sikre, at der bliver gjort noget for at fremme IT på dansk:

- Indsatsen for det danske sprog er vigtig af mange grunde - både kulturelt og socialt. Netværkssamfundet skal være for alle, og derfor skal vi have færrest mulige sproglige barrierer, så vi gør det nemmere for borgere og virksomheder at benytte netværkssamfundets mange muligheder, siger IT- og forskningsminister Birthe Weiss.

Den vigtige forskel

- Forskellen mellem en almindelig ordbog og denne ordbase er, at computeren skal kunne læse og forstå dansk. Derfor er vi nødt til at lave orddatabasen meget detaljeret med bøjningsformer, grammatik og betydninger for hvert ord, fortæller Stig Jørgensen og uddyber:

- Det kan ikke nytte noget, at computeren giver op over for et søgeord, bare fordi det står i forskellige bøjninger. Det, databasen kommer til at bestå af, er et kerneordforråd, det vil sige de mest almindelige danske ord og andre vigtige betegnelser - for eksempel IT-ord, der ofte er engelske ord brugt på dansk. Vi tager selvfølgelig udgangspunkt i de korrekte bøjninger og stavemåder, men støder vi på ord, der næsten konsekvent bliver stavet anderledes end retskrivningsordbogens forskrifter, bliver det markeret i databasen - tillige med, at vi drøfter det med Dansk Sprognævn. Det er den slags, der er sjovt at arbejde med, og jeg er glad for, at vi er med i dette spændende projekt, slutter Stig Jørgensen.

Databasen forventes at være klar om tre år og vil indeholde cirka 50.000 ord.


Blå linie
Emil Holms Kanal 2, bygn. 22, 3., DK-2300 KBH S
Tlf: +45 35329090
Valid HTML 4.01 Strict