Arhitecturi moderne de date cu Python: Construiți și implementați conducte de date

Arhitecturi moderne de date cu Python: Un ghid practic pentru construirea și implementarea de conducte de date, depozite de date și lacuri de date cu Python (Brian Lipp)

Recenzii ale cititorilor

Rezumat:

Cartea oferă o explorare pătrunzătoare și aprofundată a arhitecturilor moderne de date, concentrându-se pe arhitectura delta, guvernanța datelor și construirea de produse de date într-un cadru de rețea de date. De asemenea, se subliniază importanța vizualizărilor de date și a aplicațiilor practice în scenarii din lumea reală folosind Python.

Avantaje:

Acoperire cuprinzătoare a arhitecturilor moderne de date, exemple practice în Python, explorare pătrunzătoare a guvernanței și integrității datelor, accent pe MLOps și integrarea vizualizărilor de date, accesibil inginerilor, analiștilor și managerilor.

Dezavantaje:

Poate fi prea tehnic pentru începători fără cunoștințe anterioare despre arhitecturile de date, unii cititori ar putea găsi profunzimea copleșitoare și este posibil să nu acopere toate subiectele în detaliu.

(pe baza a 5 recenzii ale cititorilor)

Titlul original:

Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python

Conținutul cărții:

Construiți ecosisteme de date scalabile și fiabile utilizând Data Mesh, Databricks Spark și Kafka

Caracteristici principale:

⬤ Dezvoltați abilități moderne de date utilizate în tehnologiile emergente.

⬤ Învățați metodologii pragmatice de proiectare, cum ar fi Data Mesh și lacurile de date.

⬤ Obțineți o înțelegere mai profundă a guvernanței datelor.

⬤ Cumpărarea cărții tipărite sau Kindle include o carte electronică PDF gratuită.

Descrierea cărții:

Modern Data Architectures with Python vă va învăța cum să încorporați fără probleme fluxurile dvs. de lucru de învățare automată și știință a datelor în platformele dvs. de date deschise. Veți învăța cum să luați datele dvs. și să creați lacuri deschise care funcționează cu orice tehnologie folosind tehnici încercate și adevărate, inclusiv arhitectura medalion și Delta Lake.

Pornind de la elementele fundamentale, această carte vă va ajuta să construiți conducte pe Databricks, o platformă de date deschisă, utilizând SQL și Python. Veți dobândi o înțelegere a notebook-urilor și a aplicațiilor scrise în Python utilizând instrumente standard de inginerie software, cum ar fi git, pre-commit, Jenkins și Github. În continuare, veți aprofunda procesarea datelor în flux și pe loturi utilizând Apache Spark și Confluent Kafka. Pe măsură ce avansați, veți învăța cum să vă implementați resursele utilizând infrastructura ca cod și cum să vă automatizați fluxurile de lucru și dezvoltarea codului. Deoarece capacitatea oricărei platforme de date de a gestiona și de a lucra cu AI și ML este o componentă vitală, veți explora, de asemenea, elementele de bază ale ML și cum să lucrați cu instrumentele moderne MLOps. În cele din urmă, veți obține experiență practică cu Apache Spark, una dintre tehnologiile de date cheie de pe piața actuală.

Până la sfârșitul acestei cărți, veți fi acumulat o sumedenie de cunoștințe practice și teoretice pentru a vă construi, gestiona, orchestra și arhitectura ecosistemele de date.

Ce veți învăța:

⬤ Înțelegeți modelele de date, inclusiv arhitectura delta.

⬤ Descoperiți cum să creșteți performanța cu ajutorul elementelor interne Spark.

⬤ Aflați cum să proiectați diagrame de date critice.

⬤ Explorați MLOps cu instrumente precum AutoML și MLflow.

⬤ Să vă familiarizați cu crearea de produse de date într-o rețea de date.

⬤ Descoperiți guvernanța datelor și creați încredere în datele dumneavoastră.

⬤ Introduceți vizualizările de date și tablourile de bord în practica dumneavoastră privind datele.

Pentru cine este această carte:

Această carte este destinată dezvoltatorilor, inginerilor analitici și managerilor care doresc să dezvolte în continuare un ecosistem de date în cadrul organizației lor. Deși nu sunt condiții prealabile, cunoștințele de bază de Python și experiența anterioară cu datele vă vor ajuta să citiți și să urmăriți exemplele.

Alte date despre carte:

ISBN:	9781801070492
Autor:	Brian Lipp
Editura:	Packt Pub
Limbă:	engleză
Legare:	Copertă moale

Cumpărare:

Disponibil în prezent, pe stoc.

Arhitecturi moderne de date cu Python: Un ghid practic pentru construirea și implementarea de conducte de date, depozite de date și lacuri de date cu Python

Recenzii ale cititorilor

Titlul original:

Conținutul cărții:

Alte date despre carte:

Cumpărare:

Alte cărți ale autorului:

Lucrările autorului au fost publicate de următorii editori: