Evaluare:
În general, cartea este considerată o resursă excelentă pentru curățarea datelor utilizând Python, oferind sfaturi practice, explicații clare și numeroase exemple de codare. În timp ce cartea servește atât ca o introducere cuprinzătoare pentru începători, cât și ca o referință utilă pentru cercetătorii de date cu experiență, unii recenzenți au remarcat domenii care necesită îmbunătățiri, în special în ceea ce privește formatarea codului și includerea de grafice.
Avantaje:Cartea este extrem de practică, oferind explicații clare și structurate, numeroase exemple și o multitudine de tehnici pentru curățarea, manipularea și vizualizarea datelor. Ea servește ca un excelent manual de bază pentru cei noi în domeniul științei datelor sau al inteligenței artificiale și este apreciată în special pentru perspectivele sale, organizarea și ușurința de utilizare ca ghid de referință rapidă. Recenzenții au apreciat accentul pus pe înțelegerea raționamentului din spatele sarcinilor de prelucrare a datelor, ceea ce îmbunătățește învățarea.
Dezavantaje:Unii recenzenți au semnalat probleme precum exemplele de cod slab formatate care sunt greu de citit, utilizarea minimă a graficelor, contrară analizei exploratorii tipice a datelor, și o nevoie de subiecte mai complexe, cum ar fi curățarea datelor din seriile de timp. Câțiva au remarcat că, deși servește ca un punct de plecare solid, este posibil să nu acopere în profunzime fiecare subiect avansat.
(pe baza a 28 recenzii ale cititorilor)
Python Data Cleaning Cookbook: Modern techniques and Python tools to detect and remove dirty data and extract key insights
Descoperiți cum să vă descrieți datele în detaliu, să identificați problemele legate de date și să aflați cum să le rezolvați folosind tehnici, sfaturi și trucuri frecvent utilizate
Caracteristici cheie
⬤ Să vă familiarizați cu diverse tehnici de curățare a datelor pentru a dezvălui informații esențiale.
⬤ Manipulați date de diferite complexități pentru a le modela în forma potrivită, în funcție de nevoile dvs. de afaceri.
⬤ Curățați, monitorizați și validați volume mari de date pentru a diagnostica problemele înainte de a trece la analiza datelor.
Descrierea cărții
Obținerea de date curate pentru a dezvălui informații este esențială, deoarece trecerea directă la analiza datelor fără o curățare adecvată a datelor poate duce la rezultate incorecte. Această carte vă prezintă instrumentele și tehnicile pe care le puteți aplica pentru a curăța și manipula datele cu Python. Veți începe prin a vă familiariza cu forma datelor prin utilizarea unor practici care pot fi implementate în mod obișnuit cu majoritatea surselor de date. Apoi, cartea vă învață cum să manipulați datele pentru a le obține într-o formă utilă. Veți învăța, de asemenea, cum să filtrați și să sintetizați datele pentru a obține informații și pentru a înțelege mai bine ce are sens și ce nu, împreună cu descoperirea modului de operare asupra datelor pentru a aborda problemele pe care le-ați identificat. În continuare, veți efectua sarcini cheie, cum ar fi gestionarea valorilor lipsă, validarea erorilor, eliminarea datelor duplicate, monitorizarea volumelor mari de date și gestionarea datelor aberante și a datelor invalide. În continuare, veți acoperi rețete privind utilizarea învățării supravegheate și a analizei Naive Bayes pentru a identifica valorile neașteptate și erorile de clasificare și veți genera vizualizări pentru analiza exploratorie a datelor (EDA) pentru a vizualiza valorile neașteptate. În cele din urmă, veți construi funcții și clase pe care le puteți reutiliza fără modificări atunci când aveți date noi.
Până la sfârșitul acestei cărți Python, veți fi echipat cu toate abilitățile cheie de care aveți nevoie pentru a curăța datele și a diagnostica problemele din cadrul acestora.
Ce veți învăța
⬤ Aflați cum să citiți și să analizați date dintr-o varietate de surse.
⬤ Produceți rezumate ale atributelor cadrelor, coloanelor și rândurilor de date.
⬤ Filtrarea datelor și selectarea coloanelor de interes care îndeplinesc anumite criterii.
⬤ Abordarea problemelor legate de datele complicate, inclusiv lucrul cu datele și valorile lipsă.
⬤ Îmbunătățirea productivității în Python pandas prin utilizarea înlănțuirii metodelor.
⬤ Utilizați vizualizările pentru a obține informații suplimentare și pentru a identifica potențiale probleme legate de date.
⬤ Îmbunătățiți-vă capacitatea de a afla ce se întâmplă în datele dumneavoastră.
⬤ Construiți funcții și clase definite de utilizator pentru a automatiza curățarea datelor.
Pentru cine este această carte
Această carte este pentru oricine caută modalități de a gestiona date murdare, duplicate și slabe folosind diferite instrumente și tehnici Python. Cartea are o abordare bazată pe rețete pentru a vă ajuta să învățați cum să curățați și să gestionați datele. Cunoștințe practice de programare Python sunt tot ceea ce aveți nevoie pentru a profita la maximum de carte.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)