Similaritate statistică și semantică între propoziții în limba engleză

Similaritatea statistică și semantică între propozițiile în limba engleză (Anis Zaman)

Titlul original:

Statistical and Semantic Similarity between English Sentences

Conținutul cărții:

Această carte prezintă diverși algoritmi pentru calcularea similitudinilor semantice între textele în limba engleză.

Am explorat trei algoritmi diferiți pentru calcularea similarității propozițiilor în limba engleză. Primul algoritm, care este bine explorat în literatura de specialitate (Salton și Buckley, 1988, Wu și Salton, 1981), ponderează cuvintele din fiecare propoziție în funcție de frecvența termenilor și frecvența inversă a documentelor (tf-idf ) și nu utilizează informații semantice.

Al doilea algoritm utilizează măsuri ale distanței semantice dintre cuvintele care aparțin aceleiași părți de vorbire. Al treilea algoritm combină scorurile tf-idf și scorurile distanței semantice dintre cuvinte. Am evaluat performanța celui de-al doilea și celui de-al treilea algoritm pe două seturi de date: setul de perechi de propoziții al lui O'Shea cu judecăți umane de similaritate Li et al., Aug, Rubenstein și Goodenough, 1965) și setul de date de parafrazare la nivel de propoziție al Microsoft Research Rus et al., 2012).

Pe setul de date al lui O'Shea, al treilea algoritm se potrivește mai exact cu aprecierile umane decât al doilea. Pe setul de date Microsoft, nu a existat o diferență semnificativă între cei doi algoritmi.

Alte date despre carte:

ISBN:	9783659616389
Autor:	Anis Zaman
Editura:	Lap Lambert Academic Pub
Limbă:	engleză
Legare:	Copertă moale

Cumpărare:

Disponibil în prezent, pe stoc.

Similaritatea statistică și semantică între propozițiile în limba engleză

Titlul original:

Conținutul cărții:

Alte date despre carte:

Cumpărare:

Alte cărți ale autorului:

Lucrările autorului au fost publicate de următorii editori: