[SlovLit] Samodejno povzemanje FW: [SDJT-L] JOTA - 4. januarja 2005

Miran Hladnik miran.hladnik na guest.arnes.si
Čet Dec 23 12:44:11 CET 2004


-----Original Message-----
From: sdjt-l-bounces na ijs.si [mailto:sdjt-l-bounces na ijs.si] On Behalf Of
Spela Vintar
Sent: Thursday, December 23, 2004 11:07 AM
Subject: [SDJT-L] JOTA - 4. januarja 2005

JOTA - Jezikovnotehnološki abonma

se bo dogajala še bolj intenzivno v Novem letu. Tradicionalna tretja 
Jota bo že 4. januarja 2005 ob 18.00, predaval pa bo

Jure Leskovec (IJS in CMU):

Ucenje povzemanja besedil s pretvorbo v semanticno mrezo.

Povzetek
Pri avtomatski izdelavi povzetkov iz besedil (sumarizaciji) zelimo iz 
vhodnega besedila pridobiti krajse besedilo, ki bi pa ohranilo cim vec 
pomembne informacije iz vhodnega besedila. Na trgu je trenutno vec 
produktov za sumarizacijo, ki pa vsi delujejo na osnovi rangiranja in 
selekcije stavkov iz osnovnega besedila - povzetek je torej predstavljen

kot mnozica izbranih stavkov iz originalnega besedila. V nasem pristopu 
smo ubrali drugacno pot. Dokument smo s pomocjo kompleksne lingvisticne 
analize predelali v semanticno mrezo (sestavljeno iz relacij tipa 
osebek-povedek-predmet), ki skusa "razumeti" besedilo na globljem 
nivoju. Na taki "semanticni" predstavitvi dokumentov smo uporabili 
metode strojnega ucenja za modeliranje postopka, ki ga ljudje 
uporabljajo za izdelavo povzetkov. Rezultati so se izkazali kot zelo 
dobri - z modelom se zelo priblizamo rocno narejenim povzetkom besedil.

[Špela Vintar]

Dodatne informacije o seznamu SlovLit