DigiTS

Digitekstide uurimiskeskus (DigiTS) on tekstianalüüsile keskenduv projekt, mida rahastab Euroopa Liit. Projekti raames moodustatakse uus interdistsiplinaarne uurimistiim, mis võimaldab mitmeid olulisi tegevusi. Esiteks võimaldab DigiTS keskenduda uutele teadustegevusele, sealhulgas eesti keelele suunatud suurte keelemudelite (LLMide) arendamisele ja edendamisele. Teiseks võimaldab DigiTS laiendada digihumanitaaria õpetamist kõigil kõrghariduse tasemetel. Kolmandaks loob DigiTS tugeva aluse koostööks teiste Tartu Ülikooli üksustega, GLAM-asutustega (galeriid, raamatukogud, arhiivid, muuseumid) ning valdkonna idufirmadega. Kuna tekstipõhine digihumanitaaria on seotud mitmete humanitaar- ja sotsiaalteaduste valdkondadega, suurendab DigiTS võimekust rakendada digimeetodeid tekstipõhiste andmete töötlemisel mitmetes teadusvaldkondades.


Projekti eesmärgid:

  • Tuua kokku rahvusvaheline uurimisrühm, järgides Euroopa teadlaste hartat ja teadlaste värbamise head tava.
  • Viia läbi kõrgetasemelist ja rahvusvaheliselt nähtavat teadustööd tekstipõhises digihumanitaarias koostöös Tartu Ülikooli humanitaarteaduste ja sotsiaalteaduste valdkonna instituutidega.
  • Parandada Tartu Ülikoolis digihumanitaaria õpetamise kvaliteeti ja suurendada õpetamise mitmekesisust, aidata koostööüksustele rakendada tekstianalüüsi meetodeid ning koolitada tulevasi teadlasi ja GLAM-sektori spetsialiste.
  • Aidata kaasa tekstipõhise andmebaasi arendamisele ja haldamisele suurte keelemudelite jaoks, pakkudes asjatundlikkust eesti keele ja mittestandardsete keelevariantide tekstianalüüsi valdkonnas.
  • Tagada DigiTSi tulemuste jätkusuutlikkus, toetades uusi projekte ja projektitaotluste kirjutamist digitekstide uurimiskeskuses.


DigiTSi teadusstrateegia keskendub tipptasemel arvutipõhiste tekstianalüüsi meetodite arendamisele, et käsitleda uurimisküsimusi nagu tekstide sarnasus, intertekstuaalsus, info liikumine tekstide vahel jne. Neid küsimusi esitatakse sageli teabeotsingu ja -töötluse, andmeanalüüsi, klassifitseerimise, kohtuekspertiisi tekstiuuringute, arvutusliku kirjandusteaduse ja muude valdkondade raames. Siiski on vastav andmestik – eriti eesti keele puhul – märgatavalt napim ja keerukam kui tüüpilistes rakendustes. Seega tuleb DigiTSi uurimisrühmal tegeleda andmete hankimise, täiustamise ja analüüsiga seotud väljakutsetega.


Jälgi ka meie kodulehte ja Bluesky kontot.


Image
Logo of the European Union
Kas leidsite vajaliku informatsiooni? *
Aitäh tagasiside eest!