[SlovLit] Internet in šumniki
Klemen Brumec
brumec na o2.pl
Čet Jan 27 20:51:36 CET 2005
Pozdravljeni, Blaž
Pisavo (znakovni nabor) na spletnih straneh določajo kodiranja, t.i.
charseti. Osnovna kodiranja, ki so v rabi na spletu, so windows-1250,
ISO-8859-1, ISO-8859-2 ter UTF-8 (slednje manj).
Ko pridemo na stran z nedefiniranim kodiranjem, se izbere tisto, ki ga
imamo prednastavljenega v brskalniku. V internet explorerju se to
preveri v meniju Tools/Internet options, nato pa imamo na prvem jezičku
(general) spodaj gumbek Languages, kjer naj bi bilo prednastavaljeno
Slovenian (sl). S tem ponavadi dobimo čšžje na naš zaslon.
Problem pa se pojavi, ko nevešči spletni administratorji strani
postavljajo v recimo kodiranju ISO-8859-1, ki je "ameriški" kodni nabor,
nato pa v tekst vključijo čšžje. V tem primeru na zaslon dobimo
vprašaje, kakšen hecen e ter druge zanimive znake, katerih obstoje se
morda sploh nismo zavedali. Vseeno pa lahko poskusimo in "ročno"
nahecamo stran, da nam pokaže prave znake. To storimo z desnim klikom na
stran, ki je napačno prikazana, nato pa gremo na možnost Encoding
(Kodiranje) ter izberemo eno izmed predpripravljenih kodiranj (ponavadi
imamo na voljo Central european (ISO ter windows), western ISO ter UTF).
Google.com recimo uporablja UTF kodiranje (utf je unicode, torej naj bi
veljalo povsod po svetu in v vseh brskalnikih), zato bo v ISO 2 (central
european) najbrž izgledal kaj hecno.
Vmesni sklep: Kodiranja lahko izbiramo sami z desnoklikom/Encoding
(kodiranje)
Če pa spletni administrator že na ogled postavi popolnoma sesuto obliko
strani s čudnimi znaki, potem nam nič več ne more pomagati, kajti tekst
je uničen in tudi še tako zavzeto spreminjanje kodiranj ga ne povrne več
v pravo obliko. To se najpogosteje dogaja, ko kdo želi "polimati"
določene tekste z različnimi kodiranji v en dokument, nato pa seveda
lahko izbere le eno kodiranje, ki pa bo prav prikazalo le določen
odstotek strani.
Lahko pa poskusite z uporabo alternativnega brskalnika Mozilla Firefox,
ki precej bolj spoštuje pravila pri kodiranju in upošteva standarde
(windows-1250, ki ga uporablja večina strani na slovenskem spletu, je
recimo microsoftov izmišljeni "standard", ki prinaša velike težave
nekaterim uporabnikom alternativnih operacijskih sistemov (linux, bsdji,
os2)-
Kako pa je s kodiranjem v elektronski pošti? Pri nas bi moral NUJNO
obveljati standard ISO 2, vendar se spet pojavi problem, saj precej
ljudi uporablja zastonjske ameriške ponudnike e-poštnih storitev
(hotmail, yahoo, msn), ki uporabljajo "ameriški ISO, torej ISO 1, ali pa
seveda windows charset. Vse to povzroči, da je izmenjavanje pisemc med
"webmailom" (pošiljanje elektronske pošte preko spletne strani) in
recimo Outlookom obogateno z najrazličnejšimi dodatnimi (ponavadi
neželenimi) znaki. Tudi Outlook - Outlook način ni vedo gotov, saj imajo
nekateri uporabniki angleške windowse (in ne slovenskih) ter s tem
angleško kodiranje (kar se da seveda nastaviti, le znati je treba).
Kaj torej storiti? Praktično ne moremo narediti nič, vsaj preprosto ne.
Ko se namreč elektronsko pismo pošlje, se mu kodiranje določi v t.i.
MIME headerju, ki ga prejemnik ne more prav hitro spreminjati.
Kot vidim, uporabljate gmail, ki je googlova storitev, zato imate na
webmailu ( Gmail <https://gmail.google.com/gmail> ) UTF (torej unicode)
standard in čšžji načeloma ne povzročajo težav.
Tudi tole pismo boste vsi tisti, ki imate pravilno nastavljene
programe/kodiranja, prijeli z vsemi vsebujočimi čšžji, če pa temu ni
tako, sta seveda dve opciji: ali sem se pri pisanju zmotil jaz ali pa je
vaš program/kodiranje narobe nastavljeno.
Rešitve? Za brskalnike smo omenili, pri elektronski pošti pa je pogoj
ta, da pošiljatelj in prejemnik uporabljata pravo kodiranje, ali pa
seveda pisanje brez strešic.
Upam, da nisem bil preveč tehničen, če koga stvar natančneje zanima, sem
seveda lahko natančnejši in spregovorim še o html headerjih in pravilnem
postavljenju strani, vendar dvomim, da to sodi v splošnejšo slovlitovsko
debato, zatorej predlagam uporabo zasebnih elektronskih pisem.
Lp pozdrav, Klemen
P.S. Oproščam se vsem tistim, ki uporabljajo slovensko različico
brskalnika Internet Explorer, ker sem navajal angleška poimenovanja
poti. Tools (Orodja), Internet options (Internetne možnosti), Central
european (srednjeevropsko) ter ostalo so najbrž izrazi, ki jih boste z
lahkoto prevedli tudi sami.
Blaž Karlin wrote:
>Pozdravljeni!
>
>Imam vprašanje v zvezi s šumniki na internetu: ker so nekateri izmed
>vas gotovo tudi računalničarji, bi vas prosil, da mi odgovorite, kako
>urejate sledeči problem - da se vam na internetu izpisujejo tudi
>šumniki? Videl sem tudi že link, da se besedilo prekodira v slovenske
>znake: je to rešitev? Mogoče kdo ve, kako se to naredi?
>
>Hvala,
>Blaž K.
>_______________________________________________
>SlovLit mailing list
>http://mailman.ijs.si/listinfo/slovlit
>Prispevke po�iljajte v goli besedilni obliki (Format --> Plain Text) na naslov slovlit na ijs.si. �umevce prikli�ite na zaslon z izbiro Format --> Encoding --> Central European (ISO).
>
>
>
-------------- naslednji del --------------
HTML priponka je prečiščena...
URL: http://mailman.ijs.si/pipermail/slovlit/attachments/20050127/53d310b3/attachment.html
Dodatne informacije o seznamu SlovLit