Adnotarea limbajului natural pentru învățarea automată: Un ghid pentru crearea de corpusuri pentru aplicații

Evaluare:   (4.7 din 5)

Adnotarea limbajului natural pentru învățarea automată: Un ghid pentru crearea de corpusuri pentru aplicații (James Pustejovsky)

Recenzii ale cititorilor

Rezumat:

Cartea este foarte apreciată pentru abordarea sa informativă și directă, în special în contextul proiectelor de NLP și machine learning. Cititorii o consideră educativă, utilă pentru crearea de aplicații și o resursă excelentă cu îndrumări practice privind adnotarea și crearea corpusurilor.

Avantaje:

Informativă și educativă, ușor de urmărit, oferă îndrumări clare privind adnotarea pentru NLP, resurse valoroase pentru proiectele NLP, potrivită atât pentru începători, cât și pentru dezvoltatori experimentați și oferă perspective noi.

Dezavantaje:

Unii cititori nu sunt siguri de utilitatea sa pentru nevoile lor specifice, iar o recenzie implică faptul că conținutul poate fi înfricoșător datorită documentării problemelor ecologice.

(pe baza a 8 recenzii ale cititorilor)

Titlul original:

Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications

Conținutul cărții:

Creați-vă propriul corpus de instruire în limbaj natural pentru învățarea automată. Indiferent dacă lucrați cu limba engleză, chineză sau orice alt limbaj natural, această carte practică vă ghidează printr-un ciclu de dezvoltare a adnotării dovedit - procesul de adăugare a metadatelor la corpus-ul dvs. de instruire pentru a ajuta algoritmii ML să lucreze mai eficient. Nu aveți nevoie de nicio experiență în programare sau lingvistică pentru a începe.

Folosind exemple detaliate la fiecare pas, veți afla cum procesul de dezvoltare a adnotării MATTER vă ajută să Modelați, Anotați, Train, Test, Evaluați și Revalizați corpus-ul de instruire. De asemenea, veți obține o prezentare completă a unui proiect de adnotare din lumea reală.

⬤ Definiți un obiectiv clar de adnotare înainte de colectarea setului de date (corpus)

⬤ Învățați instrumentele de analiză a conținutului lingvistic al corpusului dvs.

⬤ Construiți un model și o specificație pentru proiectul dvs. de adnotare.

⬤ Examinați diferitele formate de adnotare, de la XML de bază la Cadrul de adnotare lingvistică.

⬤ Crearea unui corpus gold standard care poate fi utilizat pentru antrenarea și testarea algoritmilor ML.

⬤ Selectați algoritmii ML care vor prelucra datele adnotate.

⬤ Evaluați rezultatele testelor și revizuiți sarcina de adnotare.

⬤ Învățați cum să utilizați software ușor pentru adnotarea textelor și adjudecarea adnotărilor.

Această carte este un companion perfect pentru cartea O'Reilly's Natural Language Processing with Python.

Alte date despre carte:

ISBN:9781449306663
Autor:
Editura:
Legare:Copertă moale
Anul publicării:2012
Numărul de pagini:350

Cumpărare:

Disponibil în prezent, pe stoc.

Alte cărți ale autorului:

Adnotarea limbajului natural pentru învățarea automată: Un ghid pentru crearea de corpusuri pentru...
Creați-vă propriul corpus de instruire în limbaj...
Adnotarea limbajului natural pentru învățarea automată: Un ghid pentru crearea de corpusuri pentru aplicații - Natural Language Annotation for Machine Learning: A Guide to Corpus-Building for Applications
Lexicon - The Lexicon
Ce este lexiconul, ce conține și cum este structurat? Ce principii determină funcționarea lexicului ca o componentă a gramaticii limbajului natural? Ce rol joacă...
Lexicon - The Lexicon

Lucrările autorului au fost publicate de următorii editori:

© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)