Fw: [SlovLit] Fw: besedni zaklad slov. maturantov

Miran Hladnik miran.hladnik na guest.arnes.si
Pet Dec 8 14:49:01 CET 2000


----- Original Message -----
From: JURE <jure.zupan na ki.si>
To: 'Miran Hladnik' <miran.hladnik na guest.arnes.si>
Sent: 08. december 2000 10:03
Subject: RE: [SlovLit] Fw: besedni zaklad slov. maturantov


Spoštovani kolegi

Informacija o besednih zakladih.

Bogastvo besednega zaklada  posameznih skupin slovenskega prebivlastva je,
vsaj po mojem mnenju, eden temeljnih podatkov, ki bi lahko odgovoril na
precej
vprašanj, ki so se z vso resnostjo pokazala ob objavi rezulktatov študije
OECD
o funkcionalni nepismenosti  v 23 državah. Slovenija se je odrezal
zaprepaščujoče
slabo (o tem sem pisal v Delu, Znanje, oktober 2000). Prav nizka besedilna
pismenost (sposobnost razumevanja prebranega besedila) pri vseh kategorijah
Slovencev (posredno) kaže  na dejstvo, da je:

a) njihov besedni zaklad majhen in
b) da tudi tistih besed, ki jih posamezniki obvladajo in razumejo, ne znajo
povezovati v smiselne enote.

Ob študiji besednega zaklada slovenskih novinarjev (Delo, 30. januar 1997,
stran 13)
se je pokazalo, da so v tekstih, ki so obsegali cca 7000 besed, uporabljali
v povprečju
nekaj več kot 1900 različnih. Pri tem je pomembno, da je število različnih
besed ob
dodajanju novih tekstov pri vseh šestih novinarjih že po 3000 besedah
pričelo zaostajati
za številom vseh besed (krivulja je kazala znake >nasičenja<). Zato ni
pretirano domnevati,
da bi bil, ob še tako velikem številu pregledanih besedil, besedni zaklad
povprečnega
slovenskega novinarja verjetno pod  10,000 različnih besed.

Za ZDA bi si upal s precejšnjo gotovostjo trditi, da je besedni zaklad
pišočega profesionalnega
novinarja večji kot besedni zaklad njihovega maturanta (če sem malo hudoben,
lahko
dodam, da o tem nisem povsem preprican za povprecnega slovenskega
novinarja).
Zato je najbolj bistven del vprašanja gospoda Gradišnika ("pri prevajanju
sem prišel do
podatka, da ameriški gimnazijski maturant obvlada 80.000 besed"), kaj pomeni
beseda obvlada.
Če pomeni razumevanje besede, je številka 80,000 morebiti smiselna, čeprav
verjetno pretirana.
Število bi se prav gotovo vsaj prepolovilo, če bi od maturantov zahtevali
definicije ali
razlage besed. Če pa beseda "obvlada" pomeni aktivno uporabo besede, je
podatek
povsem zanesljivo pretiran. Za primerjavo je treba vedeti, da ima SSKJ v
vseh petih
volumnih (oziroma v integralni obliki) skupaj(!) okrog 121,000 gesel,
Webstrov slovar
ameriškega jezika pa z vsemi dodatki na skoraj 2000 straneh okrog 160,000
gesel.
Zato se mi zdi podatek o 80,000 uporabljanih besedah pri maturantih vsaj za
faktor
10 previsok.

Prešeren je, npr., v vseh svojih poezijah in pesmih uporabil skupno 25,600
besed
med katerimi je bilo nekaj čez 7000 samostalnikov. Od vseh 7000 uporabljenih

samostalnikov je bilo le nekaj čez 1000 razlicnih. (Moje konkordance vseh
Prešernovih
samostalnikov bodo izšle pri Mladinski knjigi čez kakšen mesec ali dva).
Groba
ocena različnih besed, ki jih je Prešeren v vsem svojem delu uporabil, je
precej pod 10,000;
skeptična ocena bi se lahko gibala do okrog 5000.  Kljub >silnemu napredku<
informacijske tehnolgije, bi bil zelo previden pri sklepanju, da uporabljajo
današnji
maturantje kaj več različnih besed kot Prešeren.

Problem besednega zakalad bi prav gotovo zaslužil vso pozornost slovenskih
jezikoslovcev,
še posebej pa šolskih oblasti. Verjetno bi se dale narediti zelo zanimive
študije,  tudi z
doktorskimi tezami in mednarodnmi publikacijami kot koncnim rezultatom, če
bi se
problema lotili resno. Precjšen del računalniških programov in slovarjev, ki
so za
take raziskave potrebni, že obstaja obstaja. Trenutno edini večji problem
pri
računalniški obdelavi velikih količin besedil je avtomatičen izbor besednega
gesla
za vsako besed, ker računalnik pri vsaki besedi v povprečju(!) navede dve do
tri
možnosti, ki jih je treba >ročno< razrešiti. Če bi koga take raziskave
zanimale,
sem pripravljen pomagati.

Lep pozdrav vsem

Jure Zupan

----- Original Message -----
From: Branko Gradišnik <branko.gradisnik na guest.arnes.si>
To: Miran Hladnik <miran.hladnik na guest.arnes.si>
Sent: 04. december 2000 16:22
Subject: besedni zaklad slov. maturantov

> Miran,
> pri prevajanju sem prišel do podatka, da ameriški gimnazijski maturant
> obvlada 80.000 besed (kar sicer dvomim). V opombo bi vnesel, kakšno naj bi
> bilo maturantsko besedišče pri nas -- ali morda slavisti imate vsaj
> približen podatek? (In kolišen torej je...?)
> Hvala
>
> Lep pozdrav, B.G.
> Branko.Gradisnik na guest.arnes.si

Dodatne informacije o seznamu SlovLit