[SlovLit] Internet in šumniki

Klemen Brumec brumec na o2.pl
Čet Jan 27 20:51:36 CET 2005


Pozdravljeni, Blaž

Pisavo (znakovni nabor) na spletnih straneh določajo kodiranja, t.i. 
charseti. Osnovna kodiranja, ki so v rabi na spletu, so windows-1250, 
ISO-8859-1, ISO-8859-2 ter UTF-8 (slednje manj).
Ko pridemo na stran z nedefiniranim kodiranjem, se izbere tisto, ki ga 
imamo prednastavljenega v brskalniku. V internet explorerju se to 
preveri v meniju Tools/Internet options, nato pa imamo na prvem jezičku 
(general) spodaj gumbek Languages, kjer naj bi bilo prednastavaljeno 
Slovenian (sl). S tem ponavadi dobimo čšžje na naš zaslon.
Problem pa se pojavi, ko nevešči spletni administratorji strani 
postavljajo v recimo kodiranju ISO-8859-1, ki je "ameriški" kodni nabor, 
nato pa v tekst vključijo čšžje. V tem primeru na zaslon dobimo 
vprašaje, kakšen hecen e ter druge zanimive znake, katerih obstoje se 
morda sploh nismo zavedali. Vseeno pa lahko poskusimo in "ročno" 
nahecamo stran, da nam pokaže prave znake. To storimo z desnim klikom na 
stran, ki je napačno prikazana, nato pa gremo na možnost Encoding 
(Kodiranje) ter izberemo eno izmed predpripravljenih kodiranj (ponavadi 
imamo na voljo Central european (ISO ter windows), western ISO ter UTF).
Google.com recimo uporablja UTF kodiranje (utf je unicode, torej naj bi 
veljalo povsod po svetu in v vseh brskalnikih), zato bo v ISO 2 (central 
european) najbrž izgledal kaj hecno.
Vmesni sklep: Kodiranja lahko izbiramo sami z desnoklikom/Encoding 
(kodiranje)
Če pa spletni administrator že na ogled postavi popolnoma sesuto obliko 
strani s čudnimi znaki, potem nam nič več ne more pomagati, kajti tekst 
je uničen in tudi še tako zavzeto spreminjanje kodiranj ga ne povrne več 
v pravo obliko. To se najpogosteje dogaja, ko kdo želi "polimati" 
določene tekste z različnimi kodiranji v en dokument, nato pa seveda 
lahko izbere le eno kodiranje, ki pa bo prav prikazalo le določen 
odstotek strani.
Lahko pa poskusite z uporabo alternativnega brskalnika Mozilla Firefox, 
ki precej bolj spoštuje pravila pri kodiranju in upošteva standarde 
(windows-1250, ki ga uporablja večina strani na slovenskem spletu, je 
recimo microsoftov izmišljeni "standard", ki prinaša velike težave 
nekaterim uporabnikom alternativnih operacijskih sistemov (linux, bsdji, 
os2)-

Kako pa je s kodiranjem v elektronski pošti? Pri nas bi moral NUJNO 
obveljati standard ISO 2, vendar se spet pojavi problem, saj precej 
ljudi uporablja zastonjske ameriške ponudnike e-poštnih storitev 
(hotmail, yahoo, msn), ki uporabljajo "ameriški ISO, torej ISO 1, ali pa 
seveda windows charset. Vse to povzroči, da je izmenjavanje pisemc med 
"webmailom" (pošiljanje elektronske pošte preko spletne strani) in 
recimo Outlookom obogateno z najrazličnejšimi dodatnimi (ponavadi 
neželenimi) znaki. Tudi Outlook - Outlook način ni vedo gotov, saj imajo 
nekateri uporabniki angleške windowse (in ne slovenskih) ter s tem 
angleško kodiranje (kar se da seveda nastaviti, le znati je treba).
Kaj torej storiti? Praktično ne moremo narediti nič, vsaj preprosto ne. 
Ko se namreč elektronsko pismo pošlje, se mu kodiranje določi v t.i. 
MIME headerju, ki ga prejemnik ne more prav hitro spreminjati.
Kot vidim, uporabljate gmail, ki je googlova storitev, zato imate na 
webmailu ( Gmail <https://gmail.google.com/gmail> ) UTF (torej unicode) 
standard in čšžji načeloma ne povzročajo težav.
Tudi tole pismo boste vsi tisti, ki imate pravilno nastavljene 
programe/kodiranja, prijeli z vsemi vsebujočimi čšžji, če pa temu ni 
tako, sta seveda dve opciji: ali sem se pri pisanju zmotil jaz ali pa je 
vaš program/kodiranje narobe nastavljeno.

Rešitve? Za brskalnike smo omenili, pri elektronski pošti pa je pogoj 
ta, da pošiljatelj in prejemnik uporabljata pravo kodiranje, ali pa 
seveda pisanje brez strešic.

Upam, da nisem bil preveč tehničen, če koga stvar natančneje zanima, sem 
seveda lahko natančnejši in spregovorim še o html headerjih in pravilnem 
postavljenju strani, vendar dvomim, da to sodi v splošnejšo slovlitovsko 
debato, zatorej predlagam uporabo zasebnih elektronskih pisem.

Lp pozdrav, Klemen

P.S. Oproščam se vsem tistim, ki uporabljajo slovensko različico 
brskalnika Internet Explorer, ker sem navajal angleška poimenovanja 
poti. Tools (Orodja), Internet options (Internetne možnosti), Central 
european (srednjeevropsko) ter ostalo so najbrž izrazi, ki jih boste z 
lahkoto prevedli tudi sami.

Blaž Karlin wrote:

>Pozdravljeni!
>
>Imam vprašanje v zvezi s šumniki na internetu: ker so nekateri izmed
>vas gotovo tudi računalničarji, bi vas prosil, da mi odgovorite, kako
>urejate sledeči problem - da se vam na internetu izpisujejo tudi
>šumniki? Videl sem tudi že link, da se besedilo prekodira v slovenske
>znake: je to rešitev? Mogoče kdo ve, kako se to naredi?
>
>Hvala,
>Blaž K.
>_______________________________________________
>SlovLit mailing list
>http://mailman.ijs.si/listinfo/slovlit
>Prispevke po�iljajte v goli besedilni obliki (Format --> Plain Text) na naslov slovlit na ijs.si. �umevce prikli�ite na zaslon z izbiro Format --> Encoding --> Central European (ISO).
>
>  
>
-------------- naslednji del --------------
HTML priponka je prečiščena...
URL: http://mailman.ijs.si/pipermail/slovlit/attachments/20050127/53d310b3/attachment.html 


Dodatne informacije o seznamu SlovLit