VID
Viden- og Dokumenthåndtering
med sprogteknologi
Program for afsluttende VID-seminar
NYT: Præsentationer fra VID-seminar
Der er et udtalt behov hos danske virksomheder for at kunne
supplere deres eksisterende sproglige kompetence og viden med
sprogteknologiske IT-værktøjer og metoder som dels kan
støtte medarbejderne,
dels forankre viden og processer i virksomhedens IT-systemer, dels
danne grundlag for den udvikling der kræves hvis virksomhederne
skal overleve og vokse i den stadigt mere globaliserede økonomi.
VID-projektet er et forsknings- og udviklingsprojekt der har
til formål at udforske de forskellige muligheder som
sprogteknologi frembyder inden for informationssøgning og
dokumentproduktion,
og at understøtte de deltagende virksomheder i at udvikle
værktøjer til bedre udnyttelse af egen viden, samt til
bedre og mere effektiv produktion af dokumentation, herunder
flersproget dokumentation.
Foruden CST omfatter projektet på den ene side virksomhederne
Bang & Olufsen Audio Visual, Zacco A/S og Nordea AB, som i dette
projekt udgør teknologiens brugere, på den anden Navigo
Systems A/S og Ankiro,
som er teknologiproducenter. Projektet omfatter følgende
forskningsopgaver:
* analyse af de tekstuelle data virksomhederne skal kunne
håndtere for at kunne fastlægge tesauruser/ontologier for
de relevante semantiske domæner, undersøgelse af den bedst
egnede formalisme/teknologi til at udtrykke disse;
* afdækning og videreudvikling af sprogteknologiske
komponenter til brug for automatisk tekstklassifikation og
begrebsorienteret informationssøgning,
indbefattende tilpasning af sprogteknologiske 'basismoduler' til
opmærkning af tekst;
* udforskning af flertydighed i tekstuelle data som kan
vanskeliggøre informationssøgning; ligeledes den omvendte
problematik:
at samme indhold kan udformes forskelligt rent sprogligt og derfor kan
være svær at fremfinde i store datamængder;
* forskning inden for kontrolleret sprog - også set i et
flersproget perspektiv - til brug for dokumentproduktion;
herunder analyse af den sprogstil og tone som virksomhederne
ønsker at anvende, samt opstilling af modeller for dette sprog;
* undersøgelse af hvilke sprogteknologiske metoder der
kan anvendes til denne kvalitetssikring af dokumentproduktionen i form
af f.eks. termstyring og grammatikkontrol.
Projektet er støttet af Center for IT-forskning og
løber i perioden 2003-2004.
CST's kontakt
Bolette Sandford Pedersen bolette @ cst.dk
|