Evaluare:
Cartea oferă o explorare pătrunzătoare și aprofundată a arhitecturilor moderne de date, concentrându-se pe arhitectura delta, guvernanța datelor și construirea de produse de date într-un cadru de rețea de date. De asemenea, se subliniază importanța vizualizărilor de date și a aplicațiilor practice în scenarii din lumea reală folosind Python.
Avantaje:Acoperire cuprinzătoare a arhitecturilor moderne de date, exemple practice în Python, explorare pătrunzătoare a guvernanței și integrității datelor, accent pe MLOps și integrarea vizualizărilor de date, accesibil inginerilor, analiștilor și managerilor.
Dezavantaje:Poate fi prea tehnic pentru începători fără cunoștințe anterioare despre arhitecturile de date, unii cititori ar putea găsi profunzimea copleșitoare și este posibil să nu acopere toate subiectele în detaliu.
(pe baza a 5 recenzii ale cititorilor)
Modern Data Architectures with Python: A practical guide to building and deploying data pipelines, data warehouses, and data lakes with Python
Construiți ecosisteme de date scalabile și fiabile utilizând Data Mesh, Databricks Spark și Kafka
Caracteristici principale:
⬤ Dezvoltați abilități moderne de date utilizate în tehnologiile emergente.
⬤ Învățați metodologii pragmatice de proiectare, cum ar fi Data Mesh și lacurile de date.
⬤ Obțineți o înțelegere mai profundă a guvernanței datelor.
⬤ Cumpărarea cărții tipărite sau Kindle include o carte electronică PDF gratuită.
Descrierea cărții:
Modern Data Architectures with Python vă va învăța cum să încorporați fără probleme fluxurile dvs. de lucru de învățare automată și știință a datelor în platformele dvs. de date deschise. Veți învăța cum să luați datele dvs. și să creați lacuri deschise care funcționează cu orice tehnologie folosind tehnici încercate și adevărate, inclusiv arhitectura medalion și Delta Lake.
Pornind de la elementele fundamentale, această carte vă va ajuta să construiți conducte pe Databricks, o platformă de date deschisă, utilizând SQL și Python. Veți dobândi o înțelegere a notebook-urilor și a aplicațiilor scrise în Python utilizând instrumente standard de inginerie software, cum ar fi git, pre-commit, Jenkins și Github. În continuare, veți aprofunda procesarea datelor în flux și pe loturi utilizând Apache Spark și Confluent Kafka. Pe măsură ce avansați, veți învăța cum să vă implementați resursele utilizând infrastructura ca cod și cum să vă automatizați fluxurile de lucru și dezvoltarea codului. Deoarece capacitatea oricărei platforme de date de a gestiona și de a lucra cu AI și ML este o componentă vitală, veți explora, de asemenea, elementele de bază ale ML și cum să lucrați cu instrumentele moderne MLOps. În cele din urmă, veți obține experiență practică cu Apache Spark, una dintre tehnologiile de date cheie de pe piața actuală.
Până la sfârșitul acestei cărți, veți fi acumulat o sumedenie de cunoștințe practice și teoretice pentru a vă construi, gestiona, orchestra și arhitectura ecosistemele de date.
Ce veți învăța:
⬤ Înțelegeți modelele de date, inclusiv arhitectura delta.
⬤ Descoperiți cum să creșteți performanța cu ajutorul elementelor interne Spark.
⬤ Aflați cum să proiectați diagrame de date critice.
⬤ Explorați MLOps cu instrumente precum AutoML și MLflow.
⬤ Să vă familiarizați cu crearea de produse de date într-o rețea de date.
⬤ Descoperiți guvernanța datelor și creați încredere în datele dumneavoastră.
⬤ Introduceți vizualizările de date și tablourile de bord în practica dumneavoastră privind datele.
Pentru cine este această carte:
Această carte este destinată dezvoltatorilor, inginerilor analitici și managerilor care doresc să dezvolte în continuare un ecosistem de date în cadrul organizației lor. Deși nu sunt condiții prealabile, cunoștințele de bază de Python și experiența anterioară cu datele vă vor ajuta să citiți și să urmăriți exemplele.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)