Spark de înaltă performanță: Cele mai bune practici pentru scalarea și optimizarea Apache Spark

Evaluare:   (4.2 din 5)

Spark de înaltă performanță: Cele mai bune practici pentru scalarea și optimizarea Apache Spark (Holden Karau)

Recenzii ale cititorilor

Rezumat:

Cartea „High Performance Spark” oferă o explorare detaliată a scrierii de cod Spark eficient, potrivită pentru profesioniștii cu cunoștințe prealabile de Scala și Spark. Cartea se concentrează pe optimizarea performanței și oferă exemple de cod detaliate, în principal în Scala. În timp ce unii utilizatori au considerat că este o resursă bine structurată și informativă, alții au criticat accesibilitatea acesteia pentru începători și dependența mare de Scala.

Avantaje:

Ghid cuprinzător privind scrierea codului Spark de înaltă performanță.
Explicații detaliate ale conceptelor avansate și ale tehnicilor de optimizare.
Bine structurat, cu un echilibru bun între teorie și aplicații practice.
Bogat în exemple de cod care îmbunătățesc înțelegerea, în special pentru cei familiarizați cu Scala.
Prezentare clară, simplitate și diagrame utile.

Dezavantaje:

Nu este potrivit pentru începători; necesită cunoștințe prealabile despre Spark și Scala.
Accentul pus pe Scala poate îndepărta utilizatorii nefamiliarizați cu limbajul.
Unii utilizatori au simțit că este prea dens și provocator fără un mediu Spark practic.
Acoperirea limitată a anumitor subiecte, cum ar fi fluxul Spark.
Unii au considerat-o plictisitoare din cauza numărului excesiv de exemple de programare.

(pe baza a 27 recenzii ale cititorilor)

Titlul original:

High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark

Conținutul cărții:

Apache Spark este uimitor atunci când totul merge bine. Dar dacă nu ați observat îmbunătățirile de performanță la care vă așteptați sau încă nu vă simțiți suficient de încrezător pentru a utiliza Spark în producție, această carte practică este pentru dvs. Autorii Holden Karau și Rachel Warren demonstrează optimizări de performanță pentru a vă ajuta interogările Spark să ruleze mai rapid și să gestioneze dimensiuni mai mari ale datelor, utilizând în același timp mai puține resurse.

Ideală pentru inginerii software, inginerii de date, dezvoltatorii și administratorii de sistem care lucrează cu aplicații de date la scară largă, această carte descrie tehnici care pot reduce costurile cu infrastructura de date și orele dedicate dezvoltatorilor. Nu numai că veți obține o înțelegere mai cuprinzătoare a Spark, dar veți învăța și cum să o faceți să cânte.

Cu această carte, veți explora:

⬤ Cum noile interfețe ale Spark SQL îmbunătățesc performanța față de structura de date RDD a SQL.

⬤ Elegerea între unirea datelor în Core Spark și Spark SQL.

⬤ Tehnicile de obținere a maximului din transformările RDD standard.

⬤ Cum să rezolvați problemele de performanță în paradigma perechi cheie/valoare a Spark.

⬤ Scrierea de cod Spark de înaltă performanță fără Scala sau JVM.

⬤ Cum să testați funcționalitatea și performanța atunci când aplicați îmbunătățirile sugerate.

⬤ Utilizarea bibliotecilor de învățare automată Spark MLlib și Spark ML.

⬤ Componentele Streaming ale Spark și pachetele comunitare externe.

Alte date despre carte:

ISBN:9781491943205
Autor:
Editura:
Legare:Copertă moale
Anul publicării:2017
Numărul de pagini:358

Cumpărare:

Disponibil în prezent, pe stoc.

Alte cărți ale autorului:

Spark de înaltă performanță: Cele mai bune practici pentru scalarea și optimizarea Apache Spark -...
Apache Spark este uimitor atunci când totul merge...
Spark de înaltă performanță: Cele mai bune practici pentru scalarea și optimizarea Apache Spark - High Performance Spark: Best Practices for Scaling and Optimizing Apache Spark
Scalarea Python cu Ray: Aventuri în cloud și modele fără server - Scaling Python with Ray:...
Calculul fără server permite dezvoltatorilor să se...
Scalarea Python cu Ray: Aventuri în cloud și modele fără server - Scaling Python with Ray: Adventures in Cloud and Serverless Patterns
Scalarea Python cu Dask: De la știința datelor la învățarea automată - Scaling Python with Dask:...
Sistemele moderne conțin procesoare multi-core și...
Scalarea Python cu Dask: De la știința datelor la învățarea automată - Scaling Python with Dask: From Data Science to Machine Learning

Lucrările autorului au fost publicate de următorii editori:

© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)