[Solomonov Seminar] 35. Solomonov seminar
Marko Grobelnik
marko.grobelnik@ijs.si
Sun, 25 Feb 2001 15:20:15 +0100
Vabim vas na 35. Solomonov seminar, ki bo
v torek (27.2.2001) ob 13h v sejni sobi E8 (IJS).
Tokrat si bomo ogledali enega osnovnih prijemov analize podatkov:
razvrscanje v skupine (angl. clustering). V osnovi gre za dokaj
standardno funkcijo, ki jo podpirajo bolj ali manj vsi statisticni paketi.
Zadeva pa se zaplete, ko imamo podatkov prevec in standardni
postopki odpovedo (zahtevajo prevec pomnilnika ali procesorskega casa).
Zaradi teh problemov so v data mining svetu iznasli nekaj alternativnih
postopkov, ki pa nimajo omenjenih problemov. Uros Jovanovic bo
predstavil enega (verjetno najuspesnejsega) od njih.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Uros Jovanovic:
Razvrscanje (Clustering) velikih podatkovij
Metode za zbiranje podatkov v gruce (angl. data clustering, slov. razvrscanje)
so se izkazale kot koristno orodje pri iskanju odvisnosti med podatki predvsem
na podrocju klasifikacije podatkov in obdelavi slik. Pri analizi velike kolicine
podatkov pa zaradi omejenosti virov (pomnilnik, cas izvajanja) standardne
metode odpovedo. Tem tezavam se poskusa izogniti BIRCH (Balanced Iterative
Reducing and Clustering using Hierarchies), ki je namenjen za obdelavo
velikega stevila podatkov. Predstavljen bo postopek zbiranja podatkov v
gruce, primerjava z ostalimi metodami (k-means, hierarhicni postopek) in
tezave tega postopka. Predstavljen bo tudi alternativni nacin gradnje gruc,
ki poskusa odpraviti tezave BIRCH-a.