Sprogteknologi på Færøerne

Hjalmar P. Petersen, cand.mag., MA
FO-360 Sandavági
Færøerne

en (.pdf version) af denne rapport kan også downloades


Indledning

Der findes ikke mange elektroniske tekster, ejheller tekstbanker, da vi taler om færøsk, og morfologiske analyser eksisterer ikke i elektronisk form. Denne fremstilling bliver derfor kort, men vi mener, at vi har fået fat i alt, som er relevant, og som muligvis kan bruges af nordiske og andre sprogforskere. Vi oplyser, hvor forskeren eller andre interesserede kan få fat i materialet, d.e. mulige kontaktpersoner, telefonnummer og fax, og også, hvor de er tilgængelige, e-mail adresser.

Ordbøger

Fra begyndelsen af halvfemserne har man på Færøerne publiceret et vist antal ordbøger. Nogle er tilgængelige i elektronisk form, andre kun som trykte bøger. De følgende ordbøger findes på CDs og/eller disketter.

Donsk-føroysk orðabók (Dansk-færøsk ordbog) blev publiceret af Føroya Fróðskaparfelag i 1995, og man kan tilegne sig denne bog i elektronisk form, idet den findes på fire disketter. Den er lavet i det færøske redaktionsprogram RiSt. Dette program har gode søgemuligheder. Da disketterne er installeret på en PC, har man også flere søgemuligheder. Man kan søge efter enkelte ord, dele af ord/eller morfemer og idiomer og ordsekvenser samt oplysninger om brugsområde for de enkelte ord, d.e. om ordene tilhører talesproget, fysik, er lokale o.s.v. Ved at gøre brug af Ctrl. T kan man lede efter danske såvel som færøske ord, bøjningsoplysninger såsom neutrum (n.), og dele af et ord (f.eks. del*).

Programmet er kun udviklet til PC, ikke til Mac.

Kontakt:
Føroya Fróðskaparfelag
Handan Á 5
FO-100 Tórshavn
Tlf. +322074
Fax +322074
e-mail: maudh@setur.fo

Føroysk orðabók

Det som er sagt ovenfor om Donsk-føroysk orðabók (Dansk-færøsk ordbog) gælder også Føroysk orðabók (Færøsk ordbog) fra 1998, og Føroysk Samheitaorðabók (Færøsk synonymordbog) fra 2000.  Disse to findes på CDs. Ved installation lægger disse tre ordbøger sig i en fælles mappe Skjáttan (Mappen), og de samme søgemekanismer findes i alle tre ordbøger. Man kan frit skifte imellem ordbøgerne i Skjáttan ved at bruge Ctrl S.  Man kan tilegne sig Føroysk orðabók (Færøsk ordbog) ved at kontakte samme adresse som for Donsk-føroysk orðabók (d.e. Føroya Fróðskaparfelag o.s.v.), mens man kan tilegne sig synonymordbogen ved at kontakte forlaget på følgende adresse:

Stiðin
Hornavegi 16
FO-188 Tórshavn
Færøerne
Tlf. +311589
e-mail: zakarias@post.olivant.fo

Forlaget Stiðin har også en engelsk-færøsk ordbog (Ensk-føroysk orðabók), som benytter Gyldendals ordbogsprogram fra 1992. Kontaktperson er Stiðin, Hornavegi 16 o.s.v. Det er, den samme adresse som ovenfor.

Der findes andre ordbøger på færøsk. Stiði har publiceret en Dansk-færøsk ordbog, men den er ikke tilgængelig i elektronisk form.

Der arbejdes for tiden på Føroyamálsdeildin (Afdelingen for færøsk sprog, litteratur og folkemindevidenskab) på en færøsk-dansk ordbog, en Teknisk ordbog og en italiensk-færøsk ordbog. Alle disse vil formodentligt blive publiceret i papir- og elektronisk form. Det samme gælder for en færøsk-tysk orbog, som bliver redigeret af Ulf Timmermand, og en russisk-færøsk ordbog, der bliver redigeret af Johnny Thomsen. Disse personer kan kontaktes på henholdsvis disse adresser:

Ulf Timmermand
Klokkaragøtu 1
FO-100 Tórshavn
Tlf. 314776

Johnny Thomsen
undir Heygnum 3
FO-100 Tórshavn
Tlf. 313509
e-mail:
johnnythomsen@email.dk
 

Tekster

Aviser

Man har hovedsaglig to større aviser Dimmalætting og Sosialurin. Disse udkommer alle hverdage, på nær mandag og søndag.

Dimmalætting
Dimmalætting har et elektronisk arkiv fra 1998, og en stor del af deres materiale er at finde her. Materialet er tilgængeligt forudsat at man abonnerer på avisen.

De tekster, der findes i Dimmalættings arkiv, og som man kan søge på som i en almindelig tekstsøgning er:

  • Redaktionelle tekster
  • Nyheder fra Færøerne (Heimatíðindi)
  • Udenlandske nyheder (Útlendsk tíðindi)
  • Hilsener (Heilsanir)
  • Læserbreve (Lesarabrøv)
  • De gule sider (Gulu síðurnar)
Dimmalætting har et elektronisk system, som virksomhyeden Zenit har udviklet. Systemet arbejder således, at teksterne bliver lagt ind på Intranetten, hvorfra de bliver lagt manuelt ud på Internettet og tillige i avises arkiv. Alle tekster er tilgængelige på Internettet, bortset fra nyheder fra Færøerne og De gule sider. Søgningen foregår som i almindelig Word søgning, d.e. Ctrl B, hvorefter man indtaster ordet eller sekvensen, man vil søge på. En forudsætning for at sprogforskeren o.a. skal få adgang til disse tekster er, som nævnt, at vedkommende abonnerer på Dimmalætting.  Kontakt:

Adresse:
Dimmalætting
Smyrilsvegi 13
FO-100 Tórshavn
Tlf. +341200
Fax. +341201
Hjemmeside: www.dimma.fo

Sosialurin

Sosialurin har elektroniske tekster fra september 1997, og man kan få fat i disse tekster ved at abonnere på avisen.  Principielt gemmer Sosialurin alle tekster på Internettet under benævnelsen Internet Sosialurin. Teksterne forefindes også på avisens redaktion i dvd format. Dette format kan omdannes til en læsbar form uden større problemer.  På Internet Sosialurin søges der som i en almindelig tekssøgning (Ctrl. B), og man får oplysninger om denne ved at henvende sig til:

Sosialurin
Argjavegur 26
Argir
Tlf. +311820
+314871
Fax +314720
+310817
e-mail: post@sosialurin.fo
Hjemmeside: www.sosialurin.fo
 

Trykkerier

Trykkerierne har fra slutningen af firsene et forskelligartet udvalg af tekster, som man kan søge på som i en almindelig tekstsøgning. Teksterne er ikke tilgængelige for fælles benyttelse, da forlagene, forfatterne samt også trykkerierne har ophavsret på materialet.  Det er muligt at få fat i et udvalg af teksterne i forskningsøjemed ved at kontakte de trykkerier, som bliver nævnt nedenfor, hvis man kan opnå en aftale med forlagene, forfatterne og trykkerierne, som muligvis vil kræve økonomiske fordele af brug af teksterne.  Ingen af disse tekster er at finde på Internettet.

Einars prent

Adresse:
Einars Offsett
v/ Eydnu Djurhuus
Sjúrðargøtu 19/Heygsbreyt 14
Postbox 173
FO-110 Tórshavn
Tlf. +315193
+311533
e-mail: einarspr@post.olivant.fo

Einars Prent har elektroniske tekster fra 1984. Disse er svært tilgængelige, mens tekster fra ca. 1988 er mere tilgængelige. Søgemekanismen er som i en almindelig tekstsøgning.  Oplysninger om diverse tekster og adgang fås ved at henvende sig til adressen ovenfor.

Hestprent

Adresse:
Hestprent
Dvørgastígur 7
FO-100 Tórshavn
Tlf. +314555
Fax +318026
e-mail: hestoy@hestprent.fo

Hestprent har tekster i elektronisk form fra 1988. Teksterne er i ulige former og opsætninger, men de kan konverteres, selvom det tager tid, siges, til en læsbar form, hvor man kan lede efter forskellige forekomster af f.eks. ord og sekvenser, som i en almindelig tekstsøgning.

Trykkeriet har imellem 600 til 900 forskellige tryksager samt andet, som ikke bliver regnet for rigtige tryksager, d.e reklamer og andet. De bruger overvejende Mac.

Man har principielt ikke adgang til teksterne, idet forlagene ejer ophavsret. Dog kan der gives adgang til teksterne i forskningsøjemed mod et eventuelt vederlag. Kontaktadressen er som ovenfor.

Estra

Estra har diverse elektroniske tekster, der er gemt på CDs i Mac format, og man søger som i et almindeligt Word program.  Adgang får man til teksterne, hvis man kontakter dem, der har copyright til teksterne, d.e. forlag og forfattere samt trykkeriet. 

Adressen:

Estra Prent
FO 513 Syðrugøtu
Færøerne
Tlf. +282205
Fax +441673
e-mail: klestra@post.olivant.fo

Tekstbanken

På Føroyamálsdeildin (Afdelingen for færøsk sprog, litteratur og folkemindeforskning) på Fróðskaparsetur Føroya (Det færøske universitet) findes en tekstbank, som bruger et program, som kaldes DT-search. Her kan man søge på ord, sekvenser, dele af ord (morfem), og man får ordene i en kontekst.  De, som vil have adgang til tekstbanken, skal kontakte kontaktpersonen nedenfor, men det er for tiden ikke således, at enhver har adgang til banken, idet der ligger visse klausuler på nogle tekster. Tekstudvalget er forskelligartet. Man har prosa, fagtekster, nyheder, hjemmesider, chat på Internettet og andre tekster. Tekstbanken bliver løbende opdateret.

Kontaktperson:

Jógvan í Lon-Jacobsen
Fróðskaparsetur Føroya
Føroyamálsdeildin
V.U.Hammershaimbsgøtu 16
FO-100 Tórshavn
Tlf. 315304
e-mail: jogvanl@setur.fo
 

Tekster fra Lagtinget

Det færøske lagting har forskelligartede tekster på Internettet, blandt andet lovsamlingen under følgende adresse: www.logting.fo. Man leder i disse tekster som i et almindeligt Word program, og der er også links at finde på samme hjemmeside.

Blindastovnur Føroya

På Blindastovnur Føroya [Det færøske blindeinstitut] arbejdes der for øjeblikket med at lave en syntetisk tale for færøsk. Den forefindes i en betaversion, som er under omarbejdelse til en difon version. Disse er baserede på optagelser, som er foretaget af islændingen P. Helgason ved Stockholms Universitet, afdelingen for fonetik, og S. Gullbein, der overvejende arbejder med det færøske materiale. 

En løbende morfemanalyse er udarbejdet, især med hensyn til morfemgrænser, da man i f.eks. sammensatte ord skulle forvænte kort vokal foran to konsonanter - noget, som ikke altid er tilfældet, jvf. /beuksteavur/ (bókstavur "bogstav") og ikke det lydrette /bøksteavur/ (bókstavur "bogstav").  Denne morfemanalyse foreligger ikke i skriftlig form eller i nogen manual, da den er blevet løbende benyttet i det praktiske arbejde med at udvikle syntesen, d.e. i reglesættet bag ved syntesen.

Angående lånord, har de også arbejdet med trykfordelingen i lånord, og har forløbigt formuleret ti regler, som dog ikke er fyldesgørende. Igen foreligger der ikke noget skriftligt materiale, da resultaterne er direkte brugt i syntesens reglesæt.

I deres udvikling af talesyntesen, har de anskaffet en omfattende tekstbank (omkring 10 mill. ord), med tekster fra aviserne Dimmalætting og Sosialurin, og tekster fra færøske hjemmesider på Internettet og chat - de har generelt benyttet Internettet og aviserne for at oparbejde et frekvensleksikon.

Der findes også transkription af færøsk tale med mærke, hvor man har afvigelse fra den færøske udtale.

Materialet er ikke tilgængeligt for offentligheden, men man kan kontakte:

Blindastovnur Føroya
att. Sjúrður Gullbein
Íslandsvegi 10A
FO-100 Tórshavn
Tlf. +318222
e-mail: sgull@post.olivant.fo

Føroyska Málstovan

Det færøske sprognævn (Føroyska Málnevndin) har ordlister, deres pjece om sprogbrug (Orðafar), retskrivningsregler, navneloven og forskellige links på hjemmesiden www.fmn.fo, og man kan kontakte sprognævnes sekretær for yderlige oplysninger på adressen nedenfor. De links, som er nævnt, er hovedsagligt links til andre nordiske sprognævn og oplysninger til færinge om, hvor de kan finde nordiske ordbøger på Internettet.

Adresse:

Føroyska málnevndin
V.U. Hammershaimbsgøtu 16
FO-100
Tórshavn
Tlf. +312397
Fax. +318448
e-mail: mariuss@setur.fo
 

Morfemalanyser

Der findes ikke, som nævnt i begyndelsen, nogle morfemanalyser af færøsk. Dog arbejdes der for tiden af Tim Wentslau på en sådan. Denne skal hovedsagelig bruges af børn med læseproblemer. Programmet fungerer således, at man skriver f.eks. (på dansk, da han bruger en dansk model) spi- i Word. Alle forekomster af spi- vises, og ved at klikke videre på f.eks. sekvensen spis-, vises alle sammensætninger med spis-, d.e. spisebord, spisekøkken o.s.v. Programmet er endnu ikke udviklet for færøsk, men der bliver arbejded med en færøsk version.

Kontakt:

Tim Wentslau
FO-826 Trongisvágur
Føroyar
Tlf. 371555
Hjemmeside: www.auxilior.com