Evaluare:
Cartea a primit recenzii mixte, unii cititori considerând-o foarte valoroasă pentru înțelegerea și implementarea analizei textului în depozitele de date, în timp ce alții o critică pentru că este învechită și lipsită de profunzime.
Avantaje:⬤ Oferă explicații clare ale conceptelor de analiză a textului, facilitând comunicarea cu conducerea.
⬤ Oferă noi perspective asupra strategiilor de stocare și indexare, benefice pentru echipele de depozitare a datelor.
⬤ Conține idei valoroase care pot îmbunătăți practicile de manipulare și gestionare a datelor.
⬤ Unii cititori au considerat-o prea scumpă și lipsită de suficiente informații utile.
⬤ Critici privind conținutul repetitiv și dependența de concepte învechite din depozitarea tradițională a datelor.
⬤ Alții au remarcat incapacitatea autorului de a aborda în mod eficient datele nestructurate, etichetând cartea ca fiind plină de jargon și baliverne.
(pe baza a 6 recenzii ale cititorilor)
Building the Unstructured Data Warehouse: Architecture, Analysis, and Design
Aflați tehnici esențiale de la legenda depozitului de date Bill Inmon despre cum să construiți mediul de raportare de care afacerea dvs. are nevoie acum
Răspunsurile la multe întrebări de afaceri valoroase se ascund în text. Cât de bine poate mediul dvs. de raportare existent să extragă textul necesar din e-mailuri, foi de calcul și documente și să îl pună într-un format util pentru analiză și raportare? Transformarea depozitului tradițional de date într-un depozit eficient de date nestructurate necesită competențe suplimentare din partea analistului, arhitectului, proiectantului și dezvoltatorului. Această carte vă va pregăti să implementați cu succes un depozit de date nestructurate și, prin explicații clare, exemple și studii de caz, veți învăța noi tehnici și sfaturi pentru a obține și analiza cu succes texte.
Stăpâniți aceste zece obiective:
⬤ Construiți un depozit de date nestructurate folosind abordarea în 11 pași.
⬤ Integrați textul și descrieți-l în termeni de omogenitate, relevanță, mediu, volum și structură.
⬤ Supraviețuirea provocărilor, inclusiv neclaritatea, Turnul Babel și lipsa de relații naturale.
⬤ Evitați depozitul de deșeuri de date și combateți "pânza de păianjen".
⬤ Reutilizarea tehnicilor perfecționate în depozitul de date tradițional și în depozitul de date 2. 0, inclusiv dezvoltarea iterativă.
⬤ Aplicați tehnici esențiale pentru extragerea, transformarea și încărcarea textului (ETL), cum ar fi recunoașterea frazelor, filtrarea cuvintelor limită și înlocuirea sinonimelor.
⬤ Proiectarea sistemului de inventariere a documentelor și conectarea textului nestructurat la datele structurate.
⬤ Utilizați indexuri pentru o analiză eficientă a textului și taxonomii pentru o categorizare externă utilă.
⬤ Gestionarea volumelor mari de date utilizând tehnici avansate, cum ar fi indicatorii retroactivi.
⬤ Evaluați opțiunile tehnologice adecvate pentru prelucrarea datelor nestructurate, cum ar fi dispozitivele de depozitare a datelor.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)