Învățarea Spark: Analiza rapidă a datelor - Stăpânirea procesării datelor la scară largă

Învățarea Spark: Analiza fulgerătoare a datelor (S. Damji Jules)

Recenzii ale cititorilor

Rezumat:

Această carte servește drept resursă cuprinzătoare pentru învățarea Apache Spark, oferind perspective teoretice și practice detaliate. Este bine organizată, concentrându-se pe diverse componente ale Spark și incluzând imagini utile și exemple de cod. Cu toate acestea, poate fi prea elementară pentru utilizatorii experimentați și necesită unele cunoștințe anterioare de programare.

Avantaje:

⬤ Acoperă aspectele teoretice și practice ale Spark în mare profunzime
⬤ bine organizată și ușor de urmărit
⬤ oferă instrucțiuni clare, imagini utile și exemple de cod
⬤ oferă o bună introducere în Spark
⬤ include capitole despre Delta Lake și MLlib
⬤ potrivită atât pentru începători, cât și pentru utilizatorii mai experimentați care doresc o reîmprospătare.

Dezavantaje:

⬤ Unele subiecte pot fi acoperite prea superficial
⬤ necesită o înțelegere de bază până la intermediară a programării și a analizei datelor
⬤ nu este ideal pentru utilizatorii cu experiență anterioară în Spark
⬤ configurarea poate fi dificilă, în special pentru utilizatorii Mac și Windows
⬤ poate să nu fie potrivit pentru novicii compleți în tehnologie.

(pe baza a 33 recenzii ale cititorilor)

Titlul original:

Learning Spark: Lightning-Fast Data Analytics

Conținutul cărții:

Datele sunt mai mari, ajung mai repede și vin într-o varietate de formate - și toate acestea trebuie prelucrate la scară largă pentru analiză sau învățare automată. Dar cum puteți procesa eficient volume de lucru atât de variate? Intrați în Apache Spark.

Actualizată pentru a include Spark 3. 0, această a doua ediție arată inginerilor de date și cercetătorilor de date de ce structura și unificarea în Spark sunt importante. Mai exact, această carte explică cum să efectuați analize de date simple și complexe și să folosiți algoritmi de învățare automată. Prin parcursuri pas cu pas, fragmente de cod și notebook-uri, veți putea:

⬤ Învățați API-uri structurate de nivel înalt Python, SQL, Scala sau Java.

⬤ Să înțelegeți operațiunile Spark și motorul SQL.

⬤ Inspectați, reglați și depanați operațiunile Spark cu ajutorul configurațiilor Spark și al interfeței Spark UI.

⬤ Conectarea la surse de date: JSON, Parquet, CSV, Avro, ORC, Hive, S3 sau Kafka.

⬤ Efectuați analize pe loturi și fluxuri de date utilizând Structured Streaming.

⬤ Construirea de conducte de date fiabile cu Delta Lake și Spark din surse deschise.

⬤ dezvoltați conducte de învățare automată cu MLlib și produceți modele folosind MLflow.

Alte date despre carte:

ISBN:	9781492050049
Autor:	S. Damji Jules
Editura:	Oreilly Media
Legare:	Copertă moale
Anul publicării:	2020
Numărul de pagini:	300

Cumpărare:

Disponibil în prezent, pe stoc.

Învățarea Spark: Analiza fulgerătoare a datelor

Recenzii ale cititorilor

Titlul original:

Conținutul cărții:

Alte date despre carte:

Cumpărare:

Alte cărți ale autorului:

Lucrările autorului au fost publicate de următorii editori: