[SlovLit] Samodejno povzemanje FW: [SDJT-L] JOTA - 4. januarja 2005
Miran Hladnik
miran.hladnik na guest.arnes.si
Čet Dec 23 12:44:11 CET 2004
-----Original Message-----
From: sdjt-l-bounces na ijs.si [mailto:sdjt-l-bounces na ijs.si] On Behalf Of
Spela Vintar
Sent: Thursday, December 23, 2004 11:07 AM
Subject: [SDJT-L] JOTA - 4. januarja 2005
JOTA - Jezikovnotehnološki abonma
se bo dogajala še bolj intenzivno v Novem letu. Tradicionalna tretja
Jota bo že 4. januarja 2005 ob 18.00, predaval pa bo
Jure Leskovec (IJS in CMU):
Ucenje povzemanja besedil s pretvorbo v semanticno mrezo.
Povzetek
Pri avtomatski izdelavi povzetkov iz besedil (sumarizaciji) zelimo iz
vhodnega besedila pridobiti krajse besedilo, ki bi pa ohranilo cim vec
pomembne informacije iz vhodnega besedila. Na trgu je trenutno vec
produktov za sumarizacijo, ki pa vsi delujejo na osnovi rangiranja in
selekcije stavkov iz osnovnega besedila - povzetek je torej predstavljen
kot mnozica izbranih stavkov iz originalnega besedila. V nasem pristopu
smo ubrali drugacno pot. Dokument smo s pomocjo kompleksne lingvisticne
analize predelali v semanticno mrezo (sestavljeno iz relacij tipa
osebek-povedek-predmet), ki skusa "razumeti" besedilo na globljem
nivoju. Na taki "semanticni" predstavitvi dokumentov smo uporabili
metode strojnega ucenja za modeliranje postopka, ki ga ljudje
uporabljajo za izdelavo povzetkov. Rezultati so se izkazali kot zelo
dobri - z modelom se zelo priblizamo rocno narejenim povzetkom besedil.
[Špela Vintar]
Dodatne informacije o seznamu SlovLit