[Solomonov Seminar] 35. Solomonov seminar

Marko Grobelnik marko.grobelnik@ijs.si
Sun, 25 Feb 2001 15:20:15 +0100


Vabim vas na 35. Solomonov seminar, ki bo
v torek (27.2.2001) ob 13h v sejni sobi E8 (IJS).

Tokrat si bomo ogledali enega osnovnih prijemov analize podatkov: 
razvrscanje v skupine (angl. clustering). V osnovi gre za dokaj 
standardno funkcijo, ki jo podpirajo bolj ali manj vsi statisticni paketi. 
Zadeva pa se zaplete, ko imamo podatkov prevec in standardni 
postopki odpovedo (zahtevajo prevec pomnilnika ali procesorskega casa).
Zaradi teh problemov so v data mining svetu iznasli nekaj alternativnih 
postopkov, ki pa nimajo omenjenih problemov. Uros Jovanovic bo 
predstavil enega (verjetno najuspesnejsega) od njih.

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Uros Jovanovic:
                 Razvrscanje (Clustering) velikih podatkovij

Metode za zbiranje podatkov v gruce (angl. data clustering, slov. razvrscanje) 
so se izkazale kot koristno orodje pri iskanju odvisnosti med podatki predvsem 
na podrocju klasifikacije podatkov in obdelavi slik. Pri analizi velike kolicine
podatkov pa zaradi omejenosti virov (pomnilnik, cas izvajanja) standardne
metode odpovedo. Tem tezavam se poskusa izogniti BIRCH (Balanced Iterative
Reducing and Clustering using Hierarchies), ki je namenjen za obdelavo
velikega stevila podatkov. Predstavljen bo postopek zbiranja podatkov v
gruce, primerjava z ostalimi metodami (k-means, hierarhicni postopek) in
tezave tega postopka. Predstavljen bo tudi alternativni nacin gradnje gruc,
ki poskusa odpraviti tezave BIRCH-a.