IT og Sprog

Center for Sprogteknologi udbyder et 1-årigt tværfagligt tilvalg i IT og Sprog. Tilvalget går bag om den teknologiske revolution som internettet og digitaliseringen har ført med sig, nemlig at computere begynder at forstå sprog. I dag er der - alene i Danmark - over 100 millioner søgninger på Google hver eneste måned. Hver tredje gymnasieelev bruger - med eller uden lærerens velsignelse - Google Translate som hjælpeværktøj til engelsk, fransk eller tysk oversættelse, og en stor del af danskerne bruger sociale medier som Facebook og Twitter til at holde sig orienteret om, hvad der sker i verden og i deres nærmiljø.

Tilvalgspakken fokuserer på de teknologier som indgår i informationssøgning (som Google), maskinoversættelse (som Google Translate) og i sociale netværk (som Twitter og Facebook). Samtidig vil fagene introducere værktøjer til at bruge disse teknologier og medier til at kvalificere sproglige analyser og adfærdsanalyser, f.eks. ved at analysere og kvantificere sproglige forskelle mellem grupper af brugere af sociale medier. Tilvalgspakken indbefatter tre kurser på i alt 45 ECTS, som til sammen giver en indføring i en række sproglige, sprogteknologiske og datalogiske discipliner. Samlet set udgør pakken således også et vigtigt informationsteknologisk supplement til et humanistisk grundstudium, idet den giver kompetence til at kunne håndtere nogle sproglige og generelt videnstunge problemstillinger ved hjælp af IT. Endvidere får man i pakken en introduktion til programmering for humanister, hvor der fokuseres på flere af de omtalte anvendelser. Tilvalget kan med fordel følges af grundfagsstuderende fra et humanistisk fag, men er også oplagt at følge for alle dem der har interesse for kombinationen af informationsteknologi og sprog.

It i sproglige og litterære studier (Automatisk analyse af Twitter og Shakespeare)

Digitale tekstsamlinger (korpusser) er hjørnesten i moderne studier af sprog og kommunikation. Korpusser kan være alt fra Shakespeares samlede værker til de sidste ti dages dansksprogede tweets. Sådanne korpusser kan danne baggrund for utallige interessante sproglige eller litterære studier såsom at kortlægge forfatteres stilistiske præferencer og at ”afsløre” tendenser i brugeradfærd og kommunikation i sociale medier.

På dette kursus gennemgås korpusindsamling i teori og praksis, og du indføres i anvendelse af programmer, der kan bruges til automatisk at opmærke korpusser med relevante informationer. Endelig vil du blive undervist i avanceret og lingvistisk baseret korpussøgning.

Informationssøgning (Forstår Google det vi spørger om?)

I kurset kommer vi bag om teknologien i søgemaskiner som Google. Man lærer bl.a. hvordan indholdet i teksterne på internettet repræsenteres med nøgleord, hvordan sproglig analyse bruges til at forbedre resultaterne, og hvordan man evaluerer søgeresultater. Man får også kendskab til søgning og videnorganisering i Web 2.0, hvor man f.eks. gør brug af begrebssystemer, ontologier og automatisk cross-referencing. Man får samtidig kendskab til grundlæggende datalogiske begreber og lærer at skrive enkle computerprogrammer i programmeringssproget Python til brug for sproglig analyse og søgning.

Formel grammatik og maskinoversættelse (Bedre end Google translate?)

Kurset går bag om de teknologier, som anvendes i Google Translate og andre oversættelsesværktøjer. Vi undersøger fordele og ulemper ved de anvendte metoder og forsøger i det hele taget at give et overblik over hvordan maskinoversættelse har udviklet sig de seneste år, og hvor vi er på vej hen.

Se studieordningen her


Blå linie
Emil Holms Kanal 2, bygn. 22, 3., DK-2300 KBH S
Tlf: +45 35329090