[SlovLit] Grammatica Slavica -- Novi spletni korpusi za slovenščino in druge južnoslovanske jezike CLASSLA-web 2.0 -- Veliki jezikovni modeli za DH

Miran Hladnik hladnikmiran na gmail.com
Pon Mar 2 13:43:11 CET 2026


From: "Natalija Ulčnik" <natalija.ulcnik na um.si>
To: "slovlit na ijs.si" <slovlit na ijs.si>
Date: Mon, 2 Mar 2026 09:47:58 +0000
Subject: Konferenca Grammatica Slavica, prijave do 15. marca 2026

Spoštovane, spoštovani, želeli bi vas spomniti, da so prijave na
konferenco Grammatica Slavica: slovnica med tradicijo, inovacijami in
izzivi prihodnosti, ki bo 21. in 22. maja 2026 potekala na Filozofski
fakulteti Univerze v Mariboru, možne do 15. marca 2026. Na konferenci
želimo izpostaviti pomen in vpliv slovnic slovanskih jezikov ter
ovrednotiti vlogo slovničarstva v posameznih zgodovinskih obdobjih in
v današnjem času. Raziskati želimo različne vrste slovnic in njihovo
razširjenost v slovanskem prostoru ter analizirati slovnične pojave s
teoretskih in aplikativnih vidikov. Naš namen je opredeliti mesto
slovnice v izobraževalnem sistemu, preveriti načine usvajanja in
preverjanja slovničnega znanja ter njegovo obvladovanje pri govorcih
in govorkah. Pričakujemo aktualne osvetlitve slovničarstva, vključno z
novimi slovničnimi pristopi, in razmislek o vlogi slovnic v digitalni
dobi, zlasti v času skokovitega razvoja umetne inteligence. Celostno
obravnavo slovnic in slovničarstva v slovanskem jezikovnem prostoru
tako postavljamo na presečišče preteklosti, sedanjosti in prihodnosti.
Več na spletni strani https://sdmb.si/konferenca-2026/
Prijave potekajo na e-naslovu SZP2026 na gmail.com.

Natalija Ulčnik,
v imenu organizacijskega odbora

===

Od: Taja Kuzman Pungeršek <taja.kuzman na ijs.si>
Date: V pon., 2. mar. 2026 ob 12:53
Subject: [SDJT-L] Novi spletni korpusi za slovenščino in druge
južnoslovanske jezike CLASSLA-web 2.0

Pozdravljeni, z veseljem sporočamo, da smo objavili novo različico
spletnih korpusov CLASSLA-web 2.0 za slovenščino in druge
južnoslovanske jezike. Zbirka sedmih korpusov vsebuje približno 38
milijonov besedil in 17 milijard besed (od tega 4,8 milijona besedil
in 2,3 milijarde besed v slovenskem korpusu), zbranih s spleta v letu
2024. V primerjavi z različico CLASSLA-web 1.0 je nova zbirka bistveno
večja in v veliki meri vsebuje nova besedila. Korpusi so jezikoslovno
označeni, besedila pa so samodejno razvrščena po žanru in obogatena s
tematskimi oznakami.

Zbirka je uporabna za raziskave na številnih področjih, med drugim v
korpusnem jezikoslovju, leksikografiji in drugih jezikoslovnih
raziskavah, pa tudi za naloge s področja obdelave naravnega jezika,
kot so učenje in vrednotenje velikih jezikovnih modelov ter priprava
podatkovnih zbirk, omejenih na določene žanre ali teme. Vabimo vas, da
korpuse preizkusite v konkordančnikih CLARIN.SI
(https://www.clarin.si/ske/#open) ali jih prenesete iz repozitorija
CLARIN.SI: http://hdl.handle.net/11356/2079

Več informacij o korpusih CLASSLA-web najdete v članku
https://doi.org/10.48550/arXiv.2601.11170 . Vabimo vas tudi k obisku
spletne strani, ki ponuja pregled obstoječih korpusov CLASSLA-web,
dodatne informacije o njihovi pripravi, dodatne vire in navodila za
citiranje: https://clarinsi.github.io/classla-web/

Lep pozdrav,
avtorji zbirk CLASSLA-web: Taja Kuzman Pungeršek, Peter Rupnik, Vít
Suchomel in Nikola Ljubešić, ob podpori CLARIN.SI, središča CLASSLA in
projekta LLM4DH

===

Veliki jezikovni modeli za digitalno humanistiko – Delavnica za
raziskovalke in raziskovalce. Delavnico bo vodil Marko Robnik Šikonja
(UL FRI), torek, 3. marec 2026, Modra soba FF UL, 14.00–15.30 .


Dodatne informacije o seznamu SlovLit