Postimees annab sadu tuhandeid artikleid EKI-le eesti keelemudeli loomiseks

Postimees annab sadu tuhandeid artikleid EKI-le eesti keelemudeli loomiseks

Postimees ja Eesti Keele Instituut (EKI) sõlmisid koostööleppe, mille raames annab ajaleht teadlastele kasutada oma ulatusliku ajakirjandusliku arhiivi. Eesmärk on arendada Eestile oma eestikeelne keelemudel. Andmeid edastatakse krüpteeritult ja rangelt turvalisuse nõudeid järgides.

Tehnoloogia

Postimees ja Eesti Keele Instituut (EKI) on sõlminud koostööleppe, millega ajaleht loovutab teadlastele sadu tuhandeid artikleid eestikeelse tehisintellekti keeletehnoloogia arendamiseks. Tegemist on esimese sellise ulatusliku koostööga Eesti meediamaja ja teadusasutuse vahel.

Miks Eesti vajab oma keelemudelit?

Kuigi mitmed rahvusvahelised keelemudelid suudavad eesti keelega praegu rahuldavalt hakkama saada, pole nende tase EKI hinnangul kaugeltki suurepärane. Veelgi murettekitavam on mure, et uute versioonide ilmudes võib väiksemate keelte tugi isegi halveneda. Seetõttu peetakse kriitiliselt oluliseks, et kontroll eesti keele tehnoloogilise arengu üle püsiks Eesti enda kätes.

«Koostöös EKI-ga saame ühtaegu toetada teadustööd ja eestikeelse tehisintellekti arengut ning tagada, et meie väärtuslikku sisu kasutatakse kontrollitult, turvaliselt ja ühiskonna huve teenival viisil,» sõnas Postimehe esindaja Havik.

Andmete turvalisus on prioriteet

Andmete turvalisus on koostöö keskseks põhimõtteks. Kogu andmestik edastatakse EKI-le krüpteeritult turvalise andmevahetuskanali kaudu. Töö toimub rangete lepingutingimuste alusel, mis hõlmavad nii andmete anonüümimist kui ka mitmeid turvameetmeid, mis välistavad volitamata isikute ligipääsu.

EKI esindaja Silver Soomre kinnitas, et leping sündis umbes poole aasta pikkuste läbirääkimiste tulemusena, kuid mõlema poole visioon oli ühine algusest peale. «Lepinguni jõudmine võttis aega umbes pool aastat, kuid visioon oli mõlemal poolel algusest peale ühine,» lausus ta, lisades, et era- ja avaliku sektori selline koostöö on kasulik kogu Eestile, nii digitaalsele konkurentsivõimele kui ka kultuuri kestlikkusele laiemalt.

Esimesi tulemusi oodatakse aasta lõpuks

EKI meeskonnajuht Kadri Vare ütles, et instituut on koostöö algust pikisilmi oodanud. «See on väga oluline ja julge samm, et üks meediaväljaanne panustab sel viisil eesti keele teaduslikku ja tehnoloogilisse arengusse. Meil on tehnilised süsteemid valmis ning ootame võimalust andmetega tööle hakata,» selgitas ta.

Andmete liikumine ja esmane töötlemine on kavas lõpetada 2026. aasta suve jooksul. Pärast seda saab EKI hakata Postimehe materjali kasutama keeleuuringutes ning eestikeelsete keeletehnoloogiate arendamisel koos teiste kvaliteetsete keeleandmekogudega. Esimesi tulemusi oodatakse ligikaudu poole aasta pärast.

Kadri Vare väljendas lootust, et Postimehe eeskuju julgustab ka teisi Eesti meediamaju ja kirjastusi oma arhiive teadustöö tarbeks avama. «Mida kvaliteetsem on meie ühine andmestik, seda paremaid tööriistu saame tulevikus luua. Lõppkokkuvõttes võidavad sellest kõik, kaasa arvatud sisu loojad ise,» võttis ta projekti tähtsuse kokku.

Ava rakenduses →