[Solomonov Seminar] 129. Solomonov seminar
Marko Grobelnik
marko.grobelnik at ijs.si
Mon Oct 27 00:33:40 CET 2003
Vabim vas na 129. Solomonov seminar, ki bo v torek,
28. oktobra 2003 ob 13:00 uri v Veliki predavalnici IJS.
Posnetki in materiali preteklih seminarjev so dostopni
na http://solomon.ijs.si
Tokrat bosta Janez Brank in Jure Leskovec iz IJS predstavila resitev s
katero sta zmagala na letosnjem tekmovanju iz data-miniga (KDD Cup'2003 -
http://www.cs.cornell.edu/projects/kddcup/), ki je potekalo v okviru
ACM data-mining konference (KDD'2003 - http://www.acm.org/sigkdd/kdd2003/).
Zmaga je se toliko pomembnejsa, ker sta jo pridobila v mocni konkurenci
20 ekip iz ameriskih univerz in podjetij, ki se ukvarjajo z dataminingom.
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Janez Brank, Jure Leskovec:
Napovedovanje stevila dostopov do clankov na strezniku
Dana je zbirka fizikalnih clankov z znanega streznika www.arXiv.org.
Dobimo besedilo clankov, nekaj metapodatkov in graf citatov med clanki.
Za nekatere clanke vemo tudi, kolikokrat so jih uporabniki prenesli s
streznika v prvih dveh mesecih po objavi clanka v arhivu. Naloga je
napovedati to stevilo prenosov se za neko vnaprej doloceno mnozico
preostalih clankov.
To je eden od problemov z letosnjega KDD Cup-a, tekmovanja v data miningu,
ki ga organizirajo vsako leto v povezavi s konferenco KDD. Napovedi, ki sva
jih za ta problem poslala midva z Juretom, so v konkurenci osemnajstih ekip
osvojile prvo mesto. Na seminarju bom podrobneje predstavil problem in
opisal, kako sva se ga lotila. Napovedovala sva z linearnim modelom, za
ucenje sva uporabila regresijski SVM, najvec casa pa sva posvetila izbiranju
in obtezevanju atributov pred ucenjem.
Vec podrobnosti je na naslovu: http://ai.ijs.si/kddcup03/
More information about the Solomonov-seminar
mailing list