[SlovLit] Grožnja temeljnim civilizacijskim pridobitvam

Miran gmail miranhladnik1 na gmail.com
Pet Jul 27 14:38:31 CEST 2012


Od: Aleš Vaupotič <ales.vaupotic na ung.si>
Datum: 27. julij 2012 14:15
Zadeva: Re: [SlovLit] Grožnja temeljnim civilizacijskim pridobitvam
(http://mailman.ijs.si/pipermail/slovlit/2012/004181.html
http://mailman.ijs.si/pipermail/slovlit/2012/004182.html
http://mailman.ijs.si/pipermail/slovlit/2012/004183.html)

Predelava vmesnika Nove besede

Lahko smo veseli, da nas SlovLit obvešča o dogodkih in anomalijah
literarnovednega področja pri nas in po svetu. Tokrat je pred nami
zares za velik problem, ki zahteva ukrepanje - cenzura Nove besede
(http://www.lenartkucic.net/wp-content/uploads/2012/07/Institut_za_slovenski_jezik-Odlocba_ZIN-anonim.pdf).

Konkretno vprašanje je vsekakor treba deindividualizirati, in
predpostaviti, da je tisti, ki "šel špecat Novo besedo," pravzaprav
provokator iz tabora prof. Hladnika in mene - torej zagovornikov
(afirmacije dejstva) informatizacije. Namen provokacije naj bo
hipotetično prikaz obsežnosti problema, ki ga digitalizacija
informacij predstavlja.

Torej, "Nova beseda" je domnevno kršila ZVOP-1, in sicer kot je bila
na voljo inšpektorju Informacijskega pooblaščenca na dan 25. 4. 2012.
Inšpektor je v iskalno okence vnesel "osebno ime". Iskalnik spletišča
je prikazal rezultate, t. i. "izseke" iz "primarno objavljenih"
besedil, ki vsebujejo osebna imena. Gre za besedila, ki so javno
dostopna mdr. v NUK (časnik Delo, objavljena literarna dela itn.,
vendar je to dejstvo z vidika zakonodaje očitno irelevantno, str. 6).

Glede na trenutno stanje iskalnika (27. 7. 2012) - torej z vidika, ki
je časovno za odločbo in zato v njej v resnici ni sonavzoče ter zato
delno brezpredmetno, saj se nanaša na poskus prilagoditve spletnega
arhiva odločbi - se predvideva, da je inšpektor iskal besedo, kot je
"Prešeren", ne pa npr. Goethe, ki trenutno še prikaže rezultate;
smučarko s priimkom Svet najdemo prek iskanja "Svet prismučala".
Zanimivo je, da je beseda, ki označuje krvoločno žival - zapisana z
malo začetnico, tudi v kombinacijah s hudobna, temačna ali divja -
prav tako postala osebno ime.

Omenjene težave seveda niso posledica histerije upravljavcev sistema,
ampak pričakovan rezultat kratkega stika med področjem znakovnega, v
kateri deluje človek, in področjem obdelave materialnih zapisov v
Turingovih strojih, ki s pomeni in smisli nimajo nič skupnega.

Vprašanja nadzornika, ki jih je naslovil na ZRC SAZU, so bila sledeča
(izvzeta je točka razno).
1.	Ali ima spletišče pravico do izsekov iz ... Takšno vprašanje tem
konkretnem primeru ni relevantno, saj osnovni material zbirke ni bil
"ukraden", vendar pa se to vprašanje pojavlja pri mnogih drugih
podatkovnih zbirkah.
2.	Nadzornik ugotavlja, da ZRC SAZU v Novi besedi "vzpostav[lja]
zbirko osebnih podatkov" - to  domnevno sledi iz "določb 1., 2., 3. in
5. točke 6. člena ZVOP-1".
3.	Nadzornik sklepa, da spletna stran "omogoč[a] iskanje izsekov
časopisnih člankov tudi po imenu in/ali priimku posameznikov -
fizičnih oseb". Tudi to vprašanje je brezpredmetno, saj nanj teorija
novomedijske besedilnosti odgovarja v smislu prejšnjega komentarja.

Težave so očitno povezane z 2. točko, na kar nakazuje tudi sicer
irelevantno vendar indikativno dejstvo, da je v odločbi tik pred
konceptom "zbirka osebnih podatkov" tipkarska napaka na dveh mestih
druge strani odločbe.

Pojav - ki ga je treba zavarovati, tako da se pri tem uniči projekt,
kot je spletišče Nova beseda - je določen v ZVOP-1, in sicer v
naslednjih točkah 6. člena, ki določa pomene izrazov.
1.	Osebni podatek - je katerikoli podatek, ki se nanaša na
posameznika, ne glede na obliko, v kateri je izražen.
2.	Posameznik - je določena ali določljiva fizična oseba [...] pri čemer
način identifikacije ne povzroča velikih stroškov, nesorazmerno
velikega napora ali ne zahteva veliko časa.
3.	Obdelava osebnih podatkov - pomeni kakršnokoli delovanje ali niz
delovanj, ki se izvaja v zvezi z osebnimi podatki [...].
5.	Zbirka osebnih podatkov - je vsak strukturiran niz podatkov, ki
vsebuje vsaj en osebni podatek, ki je dostopen na podlagi meril, ki
omogočajo uporabo ali združevanje podatkov, ne glede na to, ali je niz
centraliziran, decentraliziran ali razpršen na funkcionalni ali
geografski podlagi; strukturiran niz podatkov je niz podatkov, ki je
organiziran na takšen način, da določi ali omogoči določljivost
posameznika.

Inštitut Frana Ramovša - kot je povzeto v odločbi - glede tega
ugovarja, češ da niz podatkov ni "strukturiran" in zato na spletišču
ne nastaja inkriminirajoč pojav. Odgovor pisca odločbe na bizaren
način strukturiranost niza podatkov izenači z računalniško podprto
informatiko - tega v zakonu, vsaj kolikor se kaže nepravniku, ni,
ravno nasprotno, zakonodaja venomer poudarja tudi primerljivost
neračunalniških kartotek itn. Vprašanje bi bilo korektno zastavljeno,
če bi vprašalo, ali je osebno ime v zbirki "označeno" prek konkretnega
sistema označevanja, t.i. "markup". Pojavlja se torej zanimivo in
pomembno vprašanje (ki bi ga kdo, ki je bolje informiran od mene,
lahko odgovoril), ali so v zbirki osebna imena dejansko označena, oz.
na kakšen način so identificirana, npr. v trenutni algoritmizaciji
cenzure.

Inštitut Frana Ramovša tudi ugotavlja, da spletišče "ne omogoča
določitve posameznika". Odgovor pisca odločbe (sklicujoč se na
Evropski parlament in Svet) pravi, da je določljivost treba razumeti
tudi v kontekstu rabe same zbirke podatkov v okviru dela samega
upravljavca, za katerega pa, zato ker ima digitaliziran korpus, seveda
velja, da lahko "določi" nesorazmerno veliko informacij v zvezi s
slovenskim jezikom, na samo osebnih podatkov v zvezi s posamezniki. Za
slikovito primerjavo: razmerje Googla do razvitega sveta je podobno
razmerju Nove besede do Slovenije.

Nadaljnje pisanje odločbe razvija misel naprej, npr. glede dedovanja
osebnih podatkov ..., vendar ostaja problem, vsaj kot ga razumem jaz,
bolj temeljen. Problematičen je pravzaprav "katerikoli podatek, ki se
nanaša na posameznika," na katerega lahko pokažemo s prstom (tudi če
se malo zmotimo). To obsega zelo veliko podatkov. Npr., če pišem
kritiko literarnega dela, ali je omemba avtorja knjige osebni podatek,
ali pa kazalka na opredmeteno sestavljeno izjavo, katere avtorja sta
pisec primarnega besedila in založnik, ki je vsebino podkrepil s svojo
finančno in simbolno avtoriteto. Ime avtorja objavljene knjige je
nedvomno nekaj drugega kot ime osebe, ki jo - kot kos mesa, ki se
giblje po prostoru in srečuje druge posameznike iz mesa in krvi -
nadzoruje zasebni detektiv. Sicer brez prekomernega navduševanja velja
v tem kontekstu omeniti umetniški projekt, ki raziskuje preimenovanje
enega od slovenskih politikov.

Druga razsežnost vprašanja se nanaša na obdelavo podatkov, ki je nujna
za delovanje institucije, kot je korpus slovenskega jezika. 4.
odstavek 9. člena ZVOP-1 pravi, da "se lahko v javnemu sektorju
izjemoma obdelujejo tisti osebni podatki, ki so nujni za izvrševanje
zakonitih pristojnosti, nalog ali obveznosti javnega sektorja, če se s
to obdelavo ne poseže v upravičen interes posameznika, na katerega se
osebni podatki nanašajo." V tej temi, ki jo odpira izmenjava med
ustvarjalci Nove besede in Informacijskim pooblaščencem, se
potencialno zasvetlika vprašanje smiselnega omejevanja. Odločba se
odloči, da izdelava dostopnega korpusa javen rabe slovenskega jezika v
tem primeru ne pretehta, kar se zdi lahkomiselno in neargumentirano.

Določljivost posameznika, ki ji, kot se zdi iz navedkov odločbe,
ustreza t. i. "anonimizacija" (tudi pri zapisu te besede se je piscu
zatresla roka na str. 6) - tj. izbris imen iz jezikovnega vzorca, to
pa se bi najbrž lahko nanašalo tudi na aluzije, še posebej če bi bile
"označene" z javnosti dostopnimi (XML) označbami -, morda kaže na
splošno gnoseološko težnjo tega dela evropsko-slovenskega prava, da bi
razumeli osebo kot nekaj nespremenljivega, to pa seveda ni ravno
pozitiven pogled na svet. Zakaj bi se potem sploh izboljševali?

Obenem dodajno, da problem, ki se razkriva, ni trivialen. Prim. npr.
(sicer ne najbolje napisano delo) "Delete: The Virtue of Forgetting in
the Digital Age" Viktorja Mayer-Schönbergerja. Morda bi bila
kratkoročna rešitev to, da se Novo besedo kot projekt posebnega pomena
v državnem in mednarodnem kontekstu eksplicitno izvzame iz ZVOP-1.

Odgovor na dilemo, ki jo demonstrira škandalozno cenzuriranje
jezikovnega korpusa, je pravzaprav nezadovoljiv. C. S. Peirce je v
svoji semiotiki vednost neposredno povezal z ekonomiko raziskovanja,
vednost je potemtakem korelat "stroškov, [...] napora ali [oz. in ...]
časa", ki je na voljo. Torej, 2. točka 6. člena ZVOP-1 se zvede v
krog. Saj ravno to je v trenutku pospeševanja hitrosti obdelave
podatkov neznanka: kako hitro lahko posamezen Slovenec, slovenska
institucija, ali pa kdor ali kar koli drug oz. drugega na svetu,
obdeluje podatke, ki so na voljo?

Lep pozdrav
Aleš Vaupotič


Dodatne informacije o seznamu SlovLit