Lexicography on Internet
This is the HTML version of my article published in NeT, Internet Magazine, 1997;13:51-3.
Also available at URL: http://www.net.hr/net_13/leksikografija.html
Leksikografija na Internetu
| Pise: | Dr.sc. Zdenko Franic |
| franic@imi.hr |
Najprimitivniji oblici leksikografskog rada na koje nailazimo od antike do današnjih vremena jesu popisi riječi nekog stranog jezika koje su iz praktičnih razloga ili naprosto iz kurioziteta sastavljali trgovci, hodočasnici ili putnici.
Od najstarijih rječnika (pisanih klinastim pismom na glinenim pločicama u Ninivi), aleksandrijske knjižnice, naših Fausta Vrančića i Belostenca (Gazophylacium) do Champolliona i kamena iz Rosete (http://tqd.advanced.org/3011/egypt1g.htm) do suvremenih lingvista, ljudi neumorno sakupljaju i objašnjavaju riječi. Dvadeseto stoljeće zapečatilo je (to i vrapci na grani već pjevaju!) prevlast engleskog jezika u znanosti i tehnici. Tako više nitko ne zna kolike milijune riječi engleski jezik zapravo ima. Procjenjuje se da ima npr. preko 750000 naziva samo za različite insekte. Nove su se riječi stvarale tolikom brzinom da je popratna logistika (rječnici) to jedva mogla slijediti. I onda se pojavio Internet (vrapci!), čiji su hiperlinkovi postali početna točka gdje svaki ozbiljniji istraživač, analitičar, znanstvenik, obavještajac... može gotovo trenutno dobiti informacije o doslovno svakom predmetu. Potrebno je samo razraditi strategiju pretraživanja, upoznati se s osnovama Booleove algebre, te u Bookmark pribilježiti URL-ove alata za pretraživanje (search engines) i dobrih on-line rječnika. Kao i njihova papirnata braća, rječnici se na Internetu dijele po načinu kako su izrađeni, jezičnom području koji obuhvaćaju, te svrsi kojoj su namijenjeni. To su jednojezični rječnici (etimologijski, povijesni, književni, sinonimni, sinonimno-antonimni itd.) U ovoj su grupi naročito interesantni enciklopedijski rječnici (tj. leksikoni), te stručni rječnici koji ograničavaju izbor i tumačenje riječi na područje neke teorijske ili praktične svrhe (medicina, filozofija, tehnika, poljoprivreda, pomorstvo itd.)
Enciklopedije
Enciklopedije stoga nisu ništa drugo nego rječnici pretežno predmetno
informativne namjene, a obuhvaćaju osobe, zemljopisna imena te znanstveno stručne
termine. Pristup poznatijim enciklopedijama (kao Britannica, Encyclopedia Americana,
Grolier Multimedia Encyclopedia, Compton's Interactive Encyclopedia, Microsoft
Encarta97 Encyclopedia, McGraw-Hill Multimedia Encyclopedia itd.), preko Interneta se
uglavnom plaća, te se ovakve (većinom multimedijske) enciklopedije najčešće prodaju na
CD ROM-ovima. Cijene se kreću od pedesetak pa do nekoliko tisuća dolara. No, i cijena
je proporcionalna kakvoći. Srećom postoji i Free Internet Encyclopedia na
http://clever.net/cam/encyclopedia.html, koja je zapravo veliki indeks linkova.
Sudeći
po posjećenosti, te broju raznih nagrada od uglednih časopisa ili rating servisa,
uključujući i Magellan (http://www.mckinley.com/), poslužitelj je odličan.
Odlične je kakvoće, također s brojnim nagradama (Top 5% of Internet sites) i
ENCYBERPEDIA, odnosno enciklopedija Cyberspace-a na
http://www.encyberpedia.com/ency.htm.
Zbog sve veće integracije biznisa i visoke tehnologije, potrebno je spomenuti i
odličan poslužitelj International Financial Encyclopaedia na
http://www.euro.net/innovation/Finance_Base/Fin_encyc.html. Tu možete naći tisuće
termina vezanih uz financije, uključujući i termine koje je normirala International
Organization for Standardization
(http://www.iso.ch/welcome.html).
Više o enciklopedijama pogledajte na: http://www.yahoo.com/text/Reference/Encyclopedia/.
I na koncu, FAQ (frequently ask questions) arhive nepresušni su (uglavnom i
najažurniji) izvor informacija i znanja, često kvalitetniji od enciklopedija. FAQfinder
projekt na http://infolab.cs.uchicago.edu/faqfinder/
je automatizirani sustav za pitanja-odgovore koji rabi akumuliranu mudrost mnogih USENET grupa.
Ostale FAQ arhive možete lako pronaći pomoću nekog alata za pretraživanje
(http://www.altavista.digital.com, http://www.hotbot.com) ili na nekoj od lista s popisom
FAQ-ova, npr.:
http://www.cis.ohio-state.edu/text/faq/usenet/.
Glosariji
Glosariji, odnosno popisi manje poznatih riječi u nekome tekstu imaju tradiciju još
od legendarne aleksandrijske biblioteke:
http://www.byu.edu/acd1/ed/InSci/286/Egypt/AlexandriaLibrary.html
kao i
http://pharos.bu.edu/Egypt/Alexandria/links.html#library. Glosarijima su bliske
nomenklature: popisi riječi koji trebaju samo fiksirati službeno prihvaćene nazive za
određeno područje, grupu predmeta postupak i sl., a koji su popraćeni paralelnim
stručnim izrazima na nekom stranom jeziku. Gosariji i nomenklature koji se mogu naći
na Mreži imaju jednu zgodnu vrlinu: neke možete spremiti na svoje računalo, te koristiti
i kasnije. Logika je stvari da ima najviše priloga iz računalstva i samoga Interneta. Tako
i zagrebačka Školska knjiga ima informatički rječnik na:
gopher://shk.skok.com.hr:70/77/hrv/test/.index/rjecnik
Još neke zgodne adrese su: The Free On-line Dictionary of Computing (FOLDOC)
na http://wombat.doc.ic.ac.uk/,
Software Technology Interest Group (STING) Software Engineering Glossary
http://dxsting.cern.ch/sting/glossary-intro.html, zatim Mathematical Programming
Glossary:
http://www-math.cudenver.edu/~hgreenbe/glossary/glossary.html, te
HTML, the complete guide:
http://math-www.uni-paderborn.de/HTML/Dictionaries/HTML-Dictionary/.
Za one pak koji (još) nisu prešli na WIN95 (zar ima i takvih?), a trebaju se snaći
u šumi akronima, evo adrese poslužitelja Windows95 Internet Hyper-Glossary:
http://www.windows95.com/connect/glossary.html.
Svakako posjetite i The New Hacker's Dictionary na:
http://www.ccil.org/jargon/jargon_toc.html. Tu ćete naći iscrpnu zbirku hakerskog
slanga, folklora, kulture i humora. Nažalost, nema alata za pretraživanje, nego se
učitavaju cijeli (poveliki) dokumenti.
Jednojezični rječnici
Dva najpoznatija englesko-engleska rječnika su svakako Webster (američki
engleski) i Oxford (britanski engleski). Izvrsno hipertekst sučelje, s vrlo detaljnim
uputama za Webster je na
http://c.gp.cs.cmu.edu:5103/prog/webster?. No, na adresi
http://www.onelook.com/ je hipertekst sučelje za čak 74
indeksirana rječnika. Brzo i odlično! Na istom mjestu provode se i istraživanja o izgovoru pojedinih pojmova u svezi Interneta, koji začudo, još uvijek nisu standardizirani (URL, GIF, Internet, Gigabyte itd.). Uključite soundblastere i na Mrežu!
Uz rječnike, u traganju za riječima i frazama, pomažu i thesaurusi. Jedan od vrlo
dobrih jest: Roget's Internet Thesaurus na:
http://www.thesaurus.com/ . Websterov je
thesaurus na istoj adresi kao i rječnik.
Dvojezični rječnici
Uz jednojezične rječnike najčešći su dvojezični rječnici koji riječi i izraze jednog
jezika objašnjavaju riječima i izrazima drugoga jezika. Po logici stvari, na Mreži se
uglavnom mogu pronaći dvojezični riječnici između engleskog i još nekog jezika (od
mongolskog pa do dijalekata američkih Indijanaca). Možda najkompletniju listu
dvojezičnih rječnika možete pronaći na
http://www.yahoo.com/text/Reference/Dictionaries/. Posjetite također, već spomenuti
Magellan (http://www.mckinley.com/) i utipkajte: dictionary.
Pravopisna provjera teksta
Tako veliko obilje leksikografskih baza podataka iskorišteno je i pri kreiranju
programa za pravopisnu provjeru tekstova te programa za prevođenje.
Svaki bolji tekst procesor, kao i HTML editor već ima ugrađen speller checker. No,
za nas je posebno interesantan HACHECK, tj. (on-line) Hrvatski Akademski Speller
CHECKer :), kojim je strojno provjeren tekst Hrvatskog leksikona. Pošaljite
elektroničkom poštom neki tekst na adresu hacheck@tel.fer.hr, tako da se deklarira:
"Subject: provjera", te ćete ubrzo dobiti elektroničku poruku koja će neke riječi vašega
teksta svrstati u četiri kategorije: ekstremno sumnjivi slovni niz, veoma sumnjivi slovni
niz, umjereno sumnjivi slovni niz i gotovo nesumnjivi slovni niz. Za hrvatske dijakritičke
znakove treba koristiti 7-bitovnu ASCII kodnu shemu. Ako je tekst izvorno nastao u
nekom word-procesoru, treba ga eksportirati kao text-file, vodeći računa o eventualnoj
konverziji znakova. Upute možete dobiti pošaljete li HACHECKU elektroničku poruku sa
subjectom upute.
U NeT-u 11 (str. 33) spominje se i HSC, DOS program za pravopisnu provjeru
tekstova na hrvatskom jeziku koji se može pronaći na
ftp://gnjilux.cc.fer.hr/pub/msdos/util/hsc150.zip. Za one koji često elektroničkom poštom komuniciraju s engleskim govornim
područjem, a koriste Netscape, CyberSpell je zgodan plug-in koji je namijenjen radu s
Mailom, a može se naći na:
http://www.inso.com/consumer/cyberspell/democybr.htm.
Strojno prevođenje
U svezi prevođenja, shareware program imena WT4W40CR.zip, tvrtke Translation
Experts Limited (http://www.tranexp.com) najnovija je inačica programa za prevođenje
s engleskog na hrvatski i obratno :). Na istom mjestu pronaći ćete programe za
prevođenje između engleskog i mnogih drugih jezika.
I na koncu, zbog mnogo linkova, HTML inačicu ovoga članka možete naći na:
http://mimi.imi.hr/~franic/articles.html. Nadam se da je članak cool, a što to zapravo
znači u kontekstu Interneta, provjerite na Mreži u nekome od gore navedenih rječnika,
slijedeći put kada budete on-line.
Last Update: 12 Feb 1997.