[SlovLit] Slovenščina v okolju NooJ -- Re: Tantadruj -- Sumljiva znanost?

Miran gmail miranhladnik1 na gmail.com
Sre Dec 24 22:59:33 CET 2014


Od: Fišer, Darja <Darja.Fiser na ff.uni-lj.si>
Datum: 24. december 2014 11.09
Zadeva: [SDJT-L] [JOTA]: Vabilo na predavanje

Vabimo vas na predavanje Kaje Dobrovoljc, zavod Trojina, ki bo
predavala okolje NooJ za procesiranje slovenskega jezika. Predavanje
bo v ponedeljek 5. 1. 2014 ob 13:50 v predavalnici R4 na Filozofski
fakulteti v Ljubljani.

Procesiranje slovenskega jezika v razvojnem okolju NooJ

Z razvojem področja gradnje in označevanja obsežnih računalniških
zbirk avtentičnih besedil se tudi v slovenskem jezikoslovju povečuje
število raziskav, ki temeljijo na njihovem preučevanju. Kljub vse
večjemu uveljavljanju korpusnih metod pa trenutno v slovenističnem
prostoru obstaja precejšen razkorak med mnogimi raziskovalnimi
priložnostmi, ki jih obstoječi korpusi ponujajo, ter njihovo
dejansko izrabo. To stanje je v določeni meri tudi posledica
pomanjkanja enostavnih orodij za kompleksnejšo obdelavo korpusnih
besedil. Kot primer računalniško zmogljivega, a jezikoslovnemu
uporabniku prijaznega orodja v prispevku predstavljamo NooJ,
jezikoslovno razvojno okolje za izdelavo obsežnih formaliziranih
opisov naravnih jezikov in njihovo uporabo v besedilnih korpusih. Na
primeru izbranih jezikovnih virov in pravil iz pilotnega modula za
slovenščino predstavimo najpomembnejše funkcionalnosti tega
razvojnega okolja in prednosti njegovega povezovanja z že
obstoječimi viri in orodji za slovenščino.

Darja Fišer, Vojko Gorjanc in Damjan Popič

===

From: Marko Snoj <marko.snoj na zrc-sazu.si>
To: <slovlit na ijs.si>
Date: Wed, 24 Dec 2014 14:58:19 +0100
Subject: Tantadruj (http://mailman.ijs.si/pipermail/slovlit/2014/005037.html)

Potek spremembe lahko osvetlim le z jezikoslovnega vidika.  Ime
Tantantadruj vsebuje dva zaporedna popolnoma enaka zloga, za nameček
pa se še tretji začne enako kot prva dva. Tako stanje v jeziku ni
stabilno in se pogosto poenostavi po postopku, ki mu rečemo
haplologija. V organskem govoru je taka jezikovna sprememba zelo
verjetna (vodomec je npr. iz vododomec, ker ta ptica domuje v brežini
nad vodo), v učenem jeziku malo manj, pa vendar imamo mineralogijo
namesto mineralologije in kondomat namesto kondomomata. Skrajšanje za
en zlog je torej težko izogibljiva nujnost, ki se je je verjetno
zavedal že Kosmač.

Marko Snoj

===

Sumljiva znanost?

Irena Orel me je vprašala, kaj si mislim o ponudbi, ki so ji jo
poslali s Science Publishing Group, da postane gostujoča urednica
tematske številke po svojem predlogu. Vabilo je generirano samodejno,
sklicuje se na naslovnikove konkretne znanstvene dosežke, zaradi
katerih se zdi vreden zaupanja, namesto honorarja mu ponujajo dve zastonj
objavi v svojih časopisih. Izdajajo več kot 100 znanstvenih časopisov
z vseh znanstvenih področij, ponujajo jih na spletu v prostem dostopu
po principu zlatega PD (avtor plača stroške objave, za bralca pa je
publikacija zastonj; več o prostem dosotpu na
https://sl.wikibooks.org/wiki/Nova_pisarija#Prosti_dostop), objave
recenzirajo, indeksira jih 10 bibliografskih inštitucij (mdr. Google
Scholar) in poskrbljeno je za njihovo vidnost. Ponudba je vabljiva za
znanstvenike iz 175 držav po celem svetu, cene za objavo segajo od 90
$ do 500 $ na članek, za Slovenijo 370 $, kar so razumne tarife.

Pokukal sem v eno njihovih revij, v International Journal of Language
and Linguistics
(http://www.sciencepublishinggroup.com/specialissue/specialissueinfo.aspx?specialissueid=501012&journalid=501)
in priznati moram, da ima vzorno urejeno spletišče za vsa tri
dosedanja leta izhajanja. Teme so aktualne, avtorji so znanstveniki,
zaposleni na univerzah, znanstveni aparat vzbuja zaupanje, članki so
vključeni v Googlovega Učenjaka, opremljeni so z DOI, imajo skratka vse
to, kar bi si želeli tudi za slovenske znanstvene revijalne objave.

Pomisleke vzbuja avtomatizirano novačenje urednikov oz. recenzentov in
komercialni videz portala (založnik na začetni strani objavlja
reklame; seveda, za sabo nima državne subvencije). Zgroženi koloradski
bibliotekar Jeffrey Beall je založbo uvrstil na svoj privatni seznam
blizu 500 predatorskih (lažnih, plenilskih) založb, ki naj bi jim šlo
samo za zaslužek
(http://scholarlyoa.com/2014/01/02/list-of-predatory-publishers-2014/),
in sestavil podobno dolg seznam posameznih sumljivih revij
(http://scholarlyoa.com/individual-journals/). Komentarji avtorjev in
urednikov pod tem seznamom vsebujejo vse mogoče, od vihanja nosu nad
pomanjkljivo angleščino posameznih člankov in strahu, da objava na
takem mestu ne bo dovolj ugledna, do pohvalnih izkušenj s
profesionalnim recenzentskim postopkom, hitrostjo in odmevnostjo
objave ter z obvladljivimi stroški.

Založbe tipa SciencePG poganjajo kot gobe po dežju: 2011 jih je bilo
18, 2012 – 23, 2013 – 225, 2014 – 477. Očitno gre za nov način
znanstvenega objavljanja, ki v perspektivi ogroža ali celo ukinja
monopol založniških korporacij, kot so Elsevier ali Thomson Reuters,
in problematizira njihovo ekskluzivno indeksiranje (o tem glej
poglavje Citatna industrija v Novi pisariji --
https://sl.wikibooks.org/wiki/Nova_pisarija#Citatna_industrija). Imena
avtorjev in urednikov, ki v opazni količini prihajajo iz tretjega
sveta, govorijo o demokratičnem potencialu novega načina znanstvenega
publiciranja. O relevantnosti informacij pa se bo treba tudi v
prihodnje odločati ob vsakem članku posebej, ne glede na to, kje je
bil objavljen. -- miran


Dodatne informacije o seznamu SlovLit