SHALLOW DISCOURSE PARSING FOR GERMAN
În ultimele câteva decenii s-au înregistrat îmbunătățiri impresionante în mai multe domenii ale procesării limbajului natural. Cu toate acestea, a face un computer să înțeleagă discursul enunțurilor dintr-un text rămâne o provocare.
Există mai multe teorii diferite care urmăresc să descrie și să analizeze structura coerentă a unui text bine scris, dar cu diferite grade de aplicabilitate și fezabilitate pentru utilizarea practică. Această carte se referă la analizarea superficială a discursului, urmând paradigma Penn Discourse TreeBank, un corpus care conține peste 1 milion de cuvinte adnotate pentru relațiile discursive. În ceea ce privește prelucrarea discursului, orice altă limbă decât engleza trebuie considerată o limbă cu resurse reduse.
Această carte se referă la analizarea discursului pentru limba germană. Disponibilitatea limitată a datelor adnotate pentru limba germană înseamnă că potențialul metodelor moderne, bazate pe învățarea profundă, care se bazează pe astfel de date este, de asemenea, limitat.
Această carte explorează măsura în care metodele de învățare automată și metodele mai recente bazate pe învățarea profundă pot fi combinate cu ingineria tradițională a caracteristicilor lingvistice pentru a îmbunătăți performanțele sarcinii de analiză a discursului. Analizatorul de discursuri superficiale end-to-end pentru limba germană dezvoltat în scopul acestei cărți este open-source și disponibil online. De asemenea, s-a lucrat la mai multe lexicoane conective în diferite limbi.
Sunt discutate strategii pentru crearea sau dezvoltarea în continuare a unor astfel de lexicoane pentru o anumită limbă, precum și sugestii privind modul de creștere a utilității acestora pentru analiza discursului superficial. Cartea va fi de interes pentru toți cei a căror activitate implică procesarea limbajului natural, în special în alte limbi decât engleza.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)