[SlovLit] Zlata paličica -- Oddaljeno branje za evropsko literarno zgodovino -- Wikivir 2021

Miran Hladnik hladnikmiran na gmail.com
Sre Dec 16 11:12:06 CET 2020


From: "Slovenski gledališki inštitut" <mihael.cepeljnik na slogi.si>
Date: Mon, 14 Dec 2020 12:28:27 +0100
Subject: Zlata paličica ali zlata jama? Poiščite odgovor z Nikom
Škrlecem (https://youtu.be/dAMmptTnZNc)

Spletna platforma Zlata paličica (http://www.zlatapalicica.si) je
referenčna baza za iskanje in prvo spoznavanje kakovostne gledališke
produkcije za otroke in mladino, ki jo je izbrala in ocenila
tričlanska strokovna komisija. Platforma je namenjena staršem,
vzgojiteljem, učiteljem ter vsem, ki radi obiskujejo gledališče in
želijo v gledališki svet vpeljati tudi odraščajoče občinstvo.

===

From: <andrejka.zejn na zrc-sazu.si>
To: slovlit na mail.ijs.si
Subject: Cost
Date: Mon, 14 Dec 2020 21:37:42 +0100

Od 3. 11. 2017 do 2. 11. 2021 poteka Akcija COST Distant Reading for
European Literary History − COST Action CA16204
(https://www.distant-reading.net/) – Oddaljeno branje za evropsko
literarno zgodovino. V njej sodelujejo raziskovalci iz 31 držav,
večinoma iz Evrope. Vodji slovenske skupine sta Katja Mihurko Poniž
(Univerza v Novi Gorici) in Marko Juvan (ZRC SAZU), v njej sodelujejo
še Miran Hladnik (Filozofska fakulteta), Aleš Vaupotič (Univerza v
Novi Gorici), Andrejka Žejn (ZRC SAZU) in Tomaž Erjavec (Inštitut
Jožef Štefan/ZRC SAZU), ki skrbi za tehnični vidik korpusa. Cilji
akcije si sledijo v treh stopnjah: postavitev korpusa zbirke evropskih
literarnih besedil (ELTeC), ki naj bi omogočil primerjavo nacionalnih
literarnih tradicij; preizkušanje in razvoj novih računalniško
podprtih metod in orodji za analizo literarnih besedil v posameznih
evropskih jezikih, a v okviru skupne evropske literarne tradicije;
oboje naj bi v končni fazi postavilo podlago za oblikovanje novih
konceptov (evropske) teorije in zgodovine literature.

Sestava korpusa kot izhodiščnega cilja je sledila vnaprej postavljenim
kriterijem »uravnoteženosti« po spolu avtorja, dolžini (kratki,
srednji, dolgi), kanoničnosti in časovnem obdobju (tri obdobja znotraj
1840 in 1920). Trenutno so v ELTec-korpusu
(https://distantreading.github.io/ELTeC/) dostopni podkorpusi v 17
evropskih jezikih, med njimi v slovenščini. 100 romanov, kolikor je
predvidenih za vsak jezik, trenutno vsebuje le 7 podkorpusov −
angleški, francoski, nemški, madžarski, portugalski, poljski in seveda
slovenski; več kot 50 besedil vsebuje še nadaljnjih 6 podkorpusov,
ostali imajo po manj kot 50 enot.

Na nedavnem virtualnem srečanju delovne skupine, zadolžene za
gradivske vire, so sodelavci 15 nacionalnih skupin predstavili
izkušnje in potek dela pri oblikovanju korpusov (za slovenskega Tomaž
Erjavec). Zlasti za t. i. »manjše literature«, med njimi slovenske, se
je izkazalo, da je bilo pri izboru besedil za vključitev v korpus
težko ali nemogoče zadostiti postavljenim kriterijem uravnoteženosti
po spolu (pomanjkanje oz. odsotnost avtoric), dolžini (premalo dolgih
besedil), kanoničnosti in času izida, kar je posledica različnih
dejavnikov (npr. predvideno obdobje je v moderni grščini obdobje
kratkih zgodb in ne romana, prepoved tiskanja knjig v litovskem jeziku
v tem obdobju). Pri procesiranju besedil za vključitev v korpus je
mogoče presenetljivo majhno število že digitaliziranih in strojno
berljivih besedil v posameznih evropskih jezikih, kar je zahtevalo
velik vložek že takoj v začetni fazi izdelave, vse od skeniranja,
razvijanja orodij za avtomatsko prepoznavo znakov (OCR) in
popravljanje besedil – vse to velja zlasti za jezike s (trenutno)
nizkim številom del v nacionalnih podkorpusih, medtem ko so bila za
slovenščino na voljo digitalizirana besedila iz treh virov: digitalna
knjižnica Jezikovni viri starejše slovenščine IMP (65), Wikivir:
Slovenska leposlovna klasika (29), e-ZISS (1), 5 romanov pa je bilo
digitaliziranih posebej za korpus. Kodiranje besedil je bilo
pretvorjeno v ELTeC TEI na nivoju 1, slovenski podkorpus (dostopen
tudi na CLARIN.SI concordancers) pa je za zdaj edini označen na nivoju
2, kar vključuje segmentacijo na besede in povedi, modernizacijo
besed, oblikoskladenjsko označitev in označitev imenskih entitet.

Ena od ključnih ugotovitev srečanja je bila, da so bile pri postavitvi
meril za sestavo korpusov podcenjene kulturne razlike med nacionalnimi
literaturami, pri čemer velja izpostaviti dejstvo, da so prijavitelji
projekta izhajali iz angleške, nemške in francoske literature. Kar pa
je ne nazadnje tudi eno od izhodišč za drugi in tretji cilj Akcije
COST.

===

Od: Urška <urska.perenic na gmail.com>
Date: V tor., 15. dec. 2020 ob 17:04
Subject: Wikivir 2021

Dragi wikivirovci in tisti, ki radi wikivirovci postali bi, kakor je
pred časom poročal že Miran Hladnik
(https://mailman.ijs.si/pipermail/slovlit/2020/007156.html), so nam
pri Ministrstvu za kulturo odobrili dvoletni projekt za leti 2020 in
2021. Leto 2020 se praktično izteka in je bilo za Wikivir uspešno,
pred vrati pa je novo leto financiranja projekta. Zato bi vas rada še
enkrat in v svojem imenu povabila k postavljanju besedil.

Prednost bomo dali prvi zbirki dramatičnih del v slovenščini z
naslovom Slovenska Talija
(https://sl.wikisource.org/wiki/Wikivir:Slovenska_leposlovna_klasika#Besedila_za_urejanje_v_letu_2021),
ki jo je izdajalo Dramatično društvo v Ljubljani. Veseli smo, da so ob
naši spodbudi v NUK-u celotno zbirko digitalizirali, seznam in vse
pdf-je besedil, med katerimi  prevladujejo vesele igre, pa najdete na
https://sl.wikisource.org/wiki/Slovenska_Talija

Prosim, če se najprej vpišete na sveži seznam sodelavcev za 2021
(https://sl.wikisource.org/wiki/Pogovor_o_Wikiviru:Slovenska_leposlovna_klasika#Sodelavci_leta_2021)
in se lotite dela. Rezervira naj vsak samo po eno besedilo, ko ga
dokonča in vpiše v evidenco korektur
(https://sl.wikisource.org/wiki/Wikivir:Evidenca_opravljenih_korektur),
pa naslednjega.

Lep pozdrav, Urška


Dodatne informacije o seznamu SlovLit