[Solomonov Seminar] 129. Solomonov seminar

Marko Grobelnik marko.grobelnik at ijs.si
Mon Oct 27 00:33:40 CET 2003


Vabim vas na 129. Solomonov seminar, ki bo v torek, 
28. oktobra 2003 ob 13:00 uri v Veliki predavalnici IJS.
Posnetki in materiali preteklih seminarjev so dostopni
na http://solomon.ijs.si

Tokrat bosta Janez Brank in Jure Leskovec iz IJS predstavila resitev s 
katero sta zmagala na letosnjem tekmovanju iz data-miniga (KDD Cup'2003 -
http://www.cs.cornell.edu/projects/kddcup/), ki je potekalo v okviru 
ACM data-mining konference (KDD'2003 - http://www.acm.org/sigkdd/kdd2003/).
Zmaga je se toliko pomembnejsa, ker sta jo pridobila v mocni konkurenci 
20 ekip iz ameriskih univerz in podjetij, ki se ukvarjajo z dataminingom.

~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Janez Brank, Jure Leskovec:

        Napovedovanje stevila dostopov do clankov na strezniku

Dana je zbirka fizikalnih clankov z znanega streznika www.arXiv.org. 
Dobimo besedilo clankov, nekaj metapodatkov in graf citatov med clanki.  
Za nekatere clanke vemo tudi, kolikokrat so jih uporabniki prenesli s
streznika v prvih dveh mesecih po objavi clanka v arhivu. Naloga je
napovedati to stevilo prenosov se za neko vnaprej doloceno mnozico
preostalih clankov.

To je eden od problemov z letosnjega KDD Cup-a, tekmovanja v data miningu,
ki ga organizirajo vsako leto v povezavi s konferenco KDD. Napovedi, ki sva
jih za ta problem poslala midva z Juretom, so v konkurenci osemnajstih ekip
osvojile prvo mesto. Na seminarju bom podrobneje predstavil problem in
opisal, kako sva se ga lotila. Napovedovala sva z linearnim modelom, za
ucenje sva uporabila regresijski SVM, najvec casa pa sva posvetila izbiranju
in obtezevanju atributov pred ucenjem.

Vec podrobnosti je na naslovu: http://ai.ijs.si/kddcup03/



More information about the Solomonov-seminar mailing list