Evaluare:
În prezent, nu există recenzii ale cititorilor. Evaluarea se bazează pe 3 voturi.
Data Cleaning
Calitatea datelor este una dintre cele mai importante probleme în gestionarea datelor, deoarece datele murdare conduc adesea la rezultate inexacte ale analizei datelor și la decizii de afaceri incorecte.
Se pare că datele de calitate slabă din întreprinderi și din guvernul SUA costă trilioane de dolari pe an. Mai multe sondaje arată că datele murdare reprezintă cel mai frecvent obstacol cu care se confruntă cercetătorii de date. Nu este surprinzător faptul că dezvoltarea unor soluții eficace și eficiente de curățare a datelor este o provocare și este plină de probleme teoretice și inginerești profunde.
Această carte este despre curățarea datelor, care este utilizată pentru a se referi la toate tipurile de sarcini și activități de detectare și reparare a erorilor din date. Mai degrabă decât să ne concentrăm pe o anumită sarcină de curățare a datelor, oferim o prezentare generală a procesului de curățare a datelor de la un capăt la altul, descriind diverse metode de detectare și reparare a erorilor și încercând să ancorăm aceste propuneri cu mai multe taxonomii și viziuni. În mod specific, abordăm patru dintre cele mai comune și importante sarcini de curățare a datelor, și anume detectarea valorilor aberante, transformarea datelor, repararea erorilor (inclusiv imputarea valorilor lipsă) și deduplicarea datelor. În plus, datorită popularității și aplicabilității în creștere a tehnicilor de învățare automată, includem un capitol care explorează în mod specific modul în care tehnicile de învățare automată sunt utilizate pentru curățarea datelor și modul în care curățarea datelor este utilizată pentru a îmbunătăți modelele de învățare automată.
Această carte este destinată să servească drept referință utilă pentru cercetătorii și practicienii care sunt interesați de domeniul calității datelor și al curățării datelor. De asemenea, ea poate fi utilizată ca manual pentru un curs universitar. Deși ne propunem să acoperim algoritmi și tehnici de ultimă oră, recunoaștem că curățarea datelor este încă un domeniu activ de cercetare și, prin urmare, oferim direcții viitoare de cercetare ori de câte ori este cazul.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)