Ingineria datelor cu Python: Lucrați cu seturi masive de date pentru a proiecta modele de date și a automatiza conductele de date utilizând Python

Evaluare:   (4.1 din 5)

Ingineria datelor cu Python: Lucrați cu seturi masive de date pentru a proiecta modele de date și a automatiza conductele de date utilizând Python (Paul Crickard)

Recenzii ale cititorilor

Rezumat:

Cartea „Data Engineering With Python” este un pachet mixt de argumente pro și contra, conform recenziilor utilizatorilor. Deși oferă o introducere solidă la conceptele cheie din ingineria datelor și este considerată ușor de citit cu exemple practice, aceasta suferă de probleme semnificative legate de acuratețea tehnică și conținutul actualizat. Mai mulți cititori au considerat că accentul pus pe anumite instrumente, în special NiFi, este înșelător, având în vedere titlul cărții, și mulți au raportat că au întâlnit o multitudine de erori și o editare slabă care împiedică aplicarea practică a materialului.

Avantaje:

Introducere solidă în conceptele de inginerie a datelor și pipelining.
Exemple practice și ilustrative, în special cu instrumente precum Pandas, Zookeeper, Kafka și Spark.
Util pentru inginerii software în tranziție și pentru cei familiarizați cu analiza datelor.
Acoperire a unei varietăți de instrumente și concepte în ingineria datelor.
Ușor de citit.

Dezavantaje:

Numeroase erori și greșeli de scriere în întreaga carte, care conduc la frustrare.
Conținutul învechit și instrucțiunile de instalare afectează în mod critic ușurința în utilizare.
Accent puternic pe SQL cu acoperire minimă a bazelor de date NoSQL.
Lacune instrucționale, în special în ceea ce privește configurarea instrumentelor precum NiFi.
Titlu înșelător, deoarece pune accentul pe NiFi în detrimentul utilizării Python.
Lipsa de claritate în exemple și referințe, ceea ce îl face dificil pentru începători.

(pe baza a 27 recenzii ale cititorilor)

Titlul original:

Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

Conținutul cărții:

Construiți, monitorizați și gestionați conducte de date în timp real pentru a crea eficient infrastructura de inginerie a datelor utilizând proiecte Apache open-source

Caracteristici principale:

⬤ Deveniți bine versați în arhitecturi de date, pregătirea datelor și abilități de optimizare a datelor cu ajutorul exemplelor practice.

⬤ Desenați modele de date și învățați cum să extrageți, transformați și încărcați (ETL) date utilizând Python.

⬤ Programați, automatizați și monitorizați conducte de date complexe în producție.

Descrierea cărții

Ingineria datelor oferă fundamentul pentru știința și analiza datelor și constituie o parte importantă a tuturor afacerilor. Această carte vă va ajuta să explorați diverse instrumente și metode care sunt utilizate pentru înțelegerea procesului de inginerie a datelor utilizând Python.

Cartea vă va arăta cum să abordați provocările cu care vă confruntați în mod obișnuit în diferite aspecte ale ingineriei datelor. Veți începe cu o introducere la elementele de bază ale ingineriei datelor, împreună cu tehnologiile și cadrele necesare pentru a construi conducte de date pentru a lucra cu seturi mari de date. Veți învăța cum să transformați și să curățați datele și cum să efectuați analize pentru a profita la maximum de datele dumneavoastră. Pe măsură ce avansați, veți descoperi cum să lucrați cu date mari de complexitate variabilă și cu baze de date de producție și cum să construiți conducte de date. Folosind exemple din lumea reală, veți construi arhitecturi pe care veți învăța cum să implementați conducte de date.

Până la sfârșitul acestei cărți Python, veți fi dobândit o înțelegere clară a tehnicilor de modelare a datelor și veți putea construi cu încredere conducte de inginerie a datelor pentru urmărirea datelor, executarea verificărilor de calitate și efectuarea modificărilor necesare în producție.

Ce veți învăța

⬤ Înțelegeți cum ingineria datelor sprijină fluxurile de lucru ale științei datelor.

⬤ Descoperiți cum să extrageți date din fișiere și baze de date și apoi să le curățați, transformați și îmbogățiți.

⬤ Configurați procesoare pentru gestionarea diferitelor formate de fișiere, precum și a bazelor de date relaționale și NoSQL.

⬤ Aflați cum să implementați o conductă de date și un tablou de bord pentru vizualizarea rezultatelor.

⬤ Utilizați staționarea și validarea pentru a verifica datele înainte de a ajunge în depozit.

⬤ Construiți conducte în timp real cu zone de staționare care efectuează validarea și gestionează eșecurile.

⬤ Să vă familiarizați cu implementarea conductelor în mediul de producție.

Cui se adresează această carte

Această carte se adresează analiștilor de date, dezvoltatorilor ETL și tuturor celor care doresc să înceapă sau să facă tranziția către domeniul ingineriei datelor sau să își reîmprospăteze cunoștințele despre ingineria datelor utilizând Python. De asemenea, această carte va fi utilă pentru studenții care intenționează să își construiască o carieră în domeniul ingineriei datelor sau pentru profesioniștii IT care se pregătesc pentru o tranziție. Nu sunt necesare cunoștințe anterioare de inginerie a datelor.

Alte date despre carte:

ISBN:9781839214189
Autor:
Editura:
Legare:Copertă moale

Cumpărare:

Disponibil în prezent, pe stoc.

Alte cărți ale autorului:

Ingineria datelor cu Python: Lucrați cu seturi masive de date pentru a proiecta modele de date și a...
Construiți, monitorizați și gestionați conducte...
Ingineria datelor cu Python: Lucrați cu seturi masive de date pentru a proiecta modele de date și a automatiza conductele de date utilizând Python - Data Engineering with Python: Work with massive datasets to design data models and automate data pipelines using Python

Lucrările autorului au fost publicate de următorii editori:

© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)