[SlovLit] Strojne vejice -- Bitis noseč -- Re: Dnevnik Ane Frank na Wikiviru
Miran Hladnik
hladnikmiran na gmail.com
Pet Feb 26 06:52:33 CET 2021
Od: Simon Krek <simon.krek na guest.arnes.si>
Date: V čet., 25. feb. 2021 ob 12:26
Subject: Center za jezikovne vire in tehnologije Univerze v Ljubljani
(CJVT UL) objavlja spletno orodje za strojno postavljanje vejic -
Vejice 1.0.
Delovanje lahko preverite na naslovu: https://orodja.cjvt.si/vejice/ .
Spletno orodje preverja postavitev vejic v slovenskih besedilih s
pomočjo jezikovnega modela BERT, izpopolnjenega za problem
postavljanja vejic. Orodje je zasnovano kot pomoč pri postavljanju
vejic in ni nadomestek za lektorski pregled besedil. Glede na teste
program trenutno deluje uspešno v 94 odstotkih primerov.
Izhodiščna verzija orodja je bila izdelana v okviru diplomskega dela
Martina Božiča Globoke nevronske mreže za postavljanje vejic v
slovenskem jeziku na Fakulteti za računalništvo in informatiko UL, pod
mentorstvom prof. Marka Robnika Šikonje.
Programska koda je dostopna v repozitoriju CLARIN.SI:
https://github.com/clarinsi/vejice
Lep pozdrav,
Simon
===
Od: Vesna Lamut <vesna.tomc-lamut na guest.arnes.si>
Date: V čet., 25. feb. 2021 ob 20:59
Subject: Re: Misliti / misliti o
Spoštovani g. Miran Hladnik! Z nadaljevanko o jezikovnem problemu
"misliti" in "misliti o" ste nas spodbudili k razmišljanju in sklepu,
da je jezik živa tvorba in da se moramo navaditi tudi na nove
jezikovne oblike. Mene pa ste ob tem spomnili na nek drug problem, ki
se sicer ne vklaplja povsem v zgornjega, a vendar je vsaj meni zelo
moteč. Zadeva vprašanje vezljivosti besedne zveze BITI NOSEČ.
Popolnoma jasno je, kakšna je jezikovna norma, kaj piše v SSKJ: 1.
knj. deležnik od nositi, 2. noseč navadno v ženskem spolu: ki ima v
telesu plod. noseča ženska/ bila je noseča s poročenim moškim. Žal pa
se vse pogosteje pojavlja ne le v pogovornem jeziku, ampak tudi v
publicističnem, naslednja oblika: bila je noseča s sinom Tilnom / bila
je noseča s hčerko / bila je noseča s tretjim otrokom ...
Nezaslišano! Ali gre za incestno razmerje? Seveda ne! Le za nekritično
prevzemanje tujih jezikovnih vzorov. Upam, da živost jezika tu ne bo
prevladala nad neskladnostjo vsebine.
Lepo vas pozdravljam
Vesna Tomc Lamut
===
https://sl.wikisource.org/wiki/Dnevnik_Ane_Frank -- Nekdo je prvemu
poglavju, ki sem ga postavil po nizozemskem Wikiviru (re:
https://mailman.ijs.si/pipermail/slovlit/2021/007292.html), dodal sken
celotne knjige, domnevam da slovenske izdaje, ki pa se od izvirnika v
marsičem razlikuje. Slovenski prevod bo v veliko pomoč, vendar ga
moramo (tudi zaradi avtorskih pravic prevajalca oz. založbe)
prilagoditi izhodiščnemu prosto uporabnemu tekstu na nizozemskem
Wikiviru. Najprej predlagam členitev (opoglavljenje) strojno prebrane
knjige na dneve, ukinitev knjižne paginacije in združitev deljenih
besed. -- miran
Dodatne informacije o seznamu SlovLit