Învățarea Spark: Analiza fulgerătoare a datelor

Evaluare:   (4.7 din 5)

Învățarea Spark: Analiza fulgerătoare a datelor (S. Damji Jules)

Recenzii ale cititorilor

Rezumat:

Această carte servește drept resursă cuprinzătoare pentru învățarea Apache Spark, oferind perspective teoretice și practice detaliate. Este bine organizată, concentrându-se pe diverse componente ale Spark și incluzând imagini utile și exemple de cod. Cu toate acestea, poate fi prea elementară pentru utilizatorii experimentați și necesită unele cunoștințe anterioare de programare.

Avantaje:

Acoperă aspectele teoretice și practice ale Spark în mare profunzime
bine organizată și ușor de urmărit
oferă instrucțiuni clare, imagini utile și exemple de cod
oferă o bună introducere în Spark
include capitole despre Delta Lake și MLlib
potrivită atât pentru începători, cât și pentru utilizatorii mai experimentați care doresc o reîmprospătare.

Dezavantaje:

Unele subiecte pot fi acoperite prea superficial
necesită o înțelegere de bază până la intermediară a programării și a analizei datelor
nu este ideal pentru utilizatorii cu experiență anterioară în Spark
configurarea poate fi dificilă, în special pentru utilizatorii Mac și Windows
poate să nu fie potrivit pentru novicii compleți în tehnologie.

(pe baza a 33 recenzii ale cititorilor)

Titlul original:

Learning Spark: Lightning-Fast Data Analytics

Conținutul cărții:

Datele sunt mai mari, ajung mai repede și vin într-o varietate de formate - și toate acestea trebuie prelucrate la scară largă pentru analiză sau învățare automată. Dar cum puteți procesa eficient volume de lucru atât de variate? Intrați în Apache Spark.

Actualizată pentru a include Spark 3. 0, această a doua ediție arată inginerilor de date și cercetătorilor de date de ce structura și unificarea în Spark sunt importante. Mai exact, această carte explică cum să efectuați analize de date simple și complexe și să folosiți algoritmi de învățare automată. Prin parcursuri pas cu pas, fragmente de cod și notebook-uri, veți putea:

⬤ Învățați API-uri structurate de nivel înalt Python, SQL, Scala sau Java.

⬤ Să înțelegeți operațiunile Spark și motorul SQL.

⬤ Inspectați, reglați și depanați operațiunile Spark cu ajutorul configurațiilor Spark și al interfeței Spark UI.

⬤ Conectarea la surse de date: JSON, Parquet, CSV, Avro, ORC, Hive, S3 sau Kafka.

⬤ Efectuați analize pe loturi și fluxuri de date utilizând Structured Streaming.

⬤ Construirea de conducte de date fiabile cu Delta Lake și Spark din surse deschise.

⬤ dezvoltați conducte de învățare automată cu MLlib și produceți modele folosind MLflow.

Alte date despre carte:

ISBN:9781492050049
Autor:
Editura:
Legare:Copertă moale
Anul publicării:2020
Numărul de pagini:300

Cumpărare:

Disponibil în prezent, pe stoc.

Alte cărți ale autorului:

Învățarea Spark: Analiza fulgerătoare a datelor - Learning Spark: Lightning-Fast Data...
Datele sunt mai mari, ajung mai repede și vin într-o...
Învățarea Spark: Analiza fulgerătoare a datelor - Learning Spark: Lightning-Fast Data Analytics

Lucrările autorului au fost publicate de următorii editori:

© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)