Evaluare:
În prezent, nu există recenzii ale cititorilor. Evaluarea se bazează pe 2 voturi.
The Unicode cookbook for linguists
Acest text este un ghid practic pentru lingviști și programatori, care lucrează cu date în medii de calcul multilingve. Sunt prezentate conceptele de bază necesare pentru a înțelege modul în care funcționează sistemele de scriere și codurile de caractere și modul în care acestea funcționează împreună la intersecția dintre standardul Unicode și Alfabetul Fonetic Internațional.
Deși aceste standarde sunt adesea întâmpinate cu frustrare de către utilizatori, ele oferă totuși cercetătorilor și programatorilor în domeniul limbilor o arhitectură computațională coerentă, necesară pentru prelucrarea, publicarea și analiza datelor lexicale din limbile lumii. Astfel, scoatem la lumină capcane comune, dar nu întotdeauna transparente, cu care se confruntă cercetătorii atunci când lucrează cu Unicode și IPA.
După ce am identificat și depășit aceste capcane implicate în realizarea interoperabilității sintactice și semantice a sistemelor de scriere și a codurilor de caractere (în măsura în care acestea pot fi interoperabile), am creat o suită de instrumente Python și R open-source pentru a lucra cu limbi care utilizează profiluri ortografice care descriu convenții ortografice specifice autorului sau documentului. În această carte de bucate descriem o specificație formală a profilurilor ortografice și furnizăm rețete folosind instrumente cu sursă deschisă pentru a arăta cum utilizatorii pot segmenta textul, îl pot analiza, identifica erorile și îl pot transforma în diferite forme scrise pentru cercetarea lingvistică comparativă.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)