Atelierul de prelucrare a datelor, ediția a doua: Creați-vă propriile informații utile folosind date din mai multe surse brute

Evaluare:   (4.6 din 5)

Atelierul de prelucrare a datelor, ediția a doua: Creați-vă propriile informații utile folosind date din mai multe surse brute (Brian Lipp)

Recenzii ale cititorilor

Rezumat:

Cartea este o resursă extrem de recomandată pentru începătorii în știința datelor, în special în domeniul prelucrării datelor. Ea oferă o abordare practică, hands-on, cu explicații și exemple detaliate. În timp ce conținutul de bază și structura sunt bine primite, mai mulți cititori au remarcat prezența unor greșeli de scriere și greșeli care ar putea deruta utilizatorii începători.

Avantaje:

Explicații diligente ale codului, construind intuiția pentru începători.
Acoperire cuprinzătoare a structurilor de date, modulelor și tehnicilor relevante pentru manipularea datelor.
Exercițiile practice și resursele descărcabile îmbunătățesc experiența de învățare.
Oferă cazuri practice de utilizare și exemple pentru a ilustra conceptele.
Potrivit atât pentru începători, cât și pentru cei care doresc să își perfecționeze abilitățile.

Dezavantaje:

Prezența unor greșeli de tipar și a unor erori în exemple, care îi pot frustra pe începători.
Cartea se concentrează pe aplicații practice („ce este”) mai degrabă decât pe explicații teoretice („de ce este”).

(pe baza a 11 recenzii ale cititorilor)

Titlul original:

The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources

Conținutul cărții:

Un ghid al începătorului pentru simplificarea proceselor ETL (Extract, Transform, Load) cu ajutorul unor sfaturi practice, trucuri și bune practici, într-un mod distractiv și interactiv

Caracteristici principale

⬤ Explorați prelucrarea datelor cu ajutorul exemplelor din lumea reală și al cazurilor de utilizare în afaceri.

⬤ Studiați diverse modalități de a extrage cea mai mare valoare din datele dvs. în timp minim.

⬤ Îmbogățiți-vă cunoștințele cu subiecte bonus, cum ar fi generarea aleatorie de date și verificarea integrității datelor.

Descrierea cărții

Deși o cantitate uriașă de date ne este ușor accesibilă, acestea nu sunt utile în forma lor brută. Pentru ca datele să fie semnificative, acestea trebuie să fie curatate și rafinate.

Dacă sunteți începător, The Data Wrangling Workshop vă va ajuta să detaliați procesul pentru dumneavoastră. Veți începe cu elementele de bază și vă veți dezvolta cunoștințele, progresând de la aspectele de bază din spatele prelucrării datelor până la utilizarea celor mai populare instrumente și tehnici.

Această carte începe prin a vă arăta cum să lucrați cu structuri de date utilizând Python. Prin exemple și activități, veți înțelege de ce ar trebui să stați departe de metodele tradiționale de curățare a datelor utilizate în alte limbaje și să profitați de rutinele specializate pre-construite în Python. Ulterior, veți învăța cum să utilizați același backend Python pentru a extrage și transforma date dintr-o serie de surse, inclusiv internetul, baze de date mari și tabele financiare Excel. Pentru a vă ajuta să vă pregătiți pentru scenarii mai dificile, cartea vă învață cum să gestionați datele lipsă sau incorecte și cum să le reformatați pe baza cerințelor instrumentului dvs. de analiză din aval.

Până la sfârșitul acestei cărți, veți fi dezvoltat o înțelegere solidă a modului de efectuare a prelucrării datelor cu Python și veți fi învățat mai multe tehnici și bune practici pentru a extrage, curăța, transforma și formata datele în mod eficient, dintr-o gamă variată de surse.

Ce veți învăța

⬤ Să vă familiarizați cu elementele de bază ale prelucrării datelor.

⬤ Înțelegeți cum să modelați datele cu generare aleatorie de date și verificări ale integrității datelor.

⬤ Descoperiți cum să examinați datele cu ajutorul statisticilor descriptive și al tehnicilor de reprezentare grafică.

⬤ Explorați cum să căutați și să recuperați informații cu ajutorul expresiilor regulate.

⬤ Explorați bibliotecile Python pentru știința datelor utilizate în mod obișnuit.

⬤ Deveniți bine familiarizați cu modul de gestionare și compensare a datelor lipsă.

Pentru cine este această carte

Atelierul Data Wrangling este conceput pentru dezvoltatori, analiști de date și analiști de afaceri care doresc să urmeze o carieră ca om de știință de date cu drepturi depline sau expert în analiză. Deși această carte se adresează începătorilor care doresc să înceapă wranglingul de date, este necesară o cunoaștere prealabilă a limbajului de programare Python pentru a înțelege cu ușurință conceptele acoperite aici. De asemenea, va fi util să aveți cunoștințe rudimentare despre bazele de date relaționale și SQL.

Alte date despre carte:

ISBN:9781839215001
Autor:
Editura:
Legare:Copertă moale

Cumpărare:

Disponibil în prezent, pe stoc.

Alte cărți ale autorului:

Atelierul de prelucrare a datelor, ediția a doua: Creați-vă propriile informații utile folosind date...
Un ghid al începătorului pentru simplificarea...
Atelierul de prelucrare a datelor, ediția a doua: Creați-vă propriile informații utile folosind date din mai multe surse brute - The Data Wrangling Workshop, Second Edition: Create your own actionable insights using data from multiple raw sources
Arhitecturi moderne de date cu Python: Un ghid practic pentru construirea și implementarea de...
Construiți ecosisteme de date scalabile și fiabile...
Arhitecturi moderne de date cu Python: Un ghid practic pentru construirea și implementarea de conducte de date, depozite de date și lacuri de date cu Python - Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Lucrările autorului au fost publicate de următorii editori:

© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)