Evaluare:
Această carte servește drept resursă cuprinzătoare pentru învățarea Apache Spark, oferind perspective teoretice și practice detaliate. Este bine organizată, concentrându-se pe diverse componente ale Spark și incluzând imagini utile și exemple de cod. Cu toate acestea, poate fi prea elementară pentru utilizatorii experimentați și necesită unele cunoștințe anterioare de programare.
Avantaje:⬤ Acoperă aspectele teoretice și practice ale Spark în mare profunzime
⬤ bine organizată și ușor de urmărit
⬤ oferă instrucțiuni clare, imagini utile și exemple de cod
⬤ oferă o bună introducere în Spark
⬤ include capitole despre Delta Lake și MLlib
⬤ potrivită atât pentru începători, cât și pentru utilizatorii mai experimentați care doresc o reîmprospătare.
⬤ Unele subiecte pot fi acoperite prea superficial
⬤ necesită o înțelegere de bază până la intermediară a programării și a analizei datelor
⬤ nu este ideal pentru utilizatorii cu experiență anterioară în Spark
⬤ configurarea poate fi dificilă, în special pentru utilizatorii Mac și Windows
⬤ poate să nu fie potrivit pentru novicii compleți în tehnologie.
(pe baza a 33 recenzii ale cititorilor)
Learning Spark: Lightning-Fast Data Analytics
Datele sunt mai mari, ajung mai repede și vin într-o varietate de formate - și toate acestea trebuie prelucrate la scară largă pentru analiză sau învățare automată. Dar cum puteți procesa eficient volume de lucru atât de variate? Intrați în Apache Spark.
Actualizată pentru a include Spark 3. 0, această a doua ediție arată inginerilor de date și cercetătorilor de date de ce structura și unificarea în Spark sunt importante. Mai exact, această carte explică cum să efectuați analize de date simple și complexe și să folosiți algoritmi de învățare automată. Prin parcursuri pas cu pas, fragmente de cod și notebook-uri, veți putea:
⬤ Învățați API-uri structurate de nivel înalt Python, SQL, Scala sau Java.
⬤ Să înțelegeți operațiunile Spark și motorul SQL.
⬤ Inspectați, reglați și depanați operațiunile Spark cu ajutorul configurațiilor Spark și al interfeței Spark UI.
⬤ Conectarea la surse de date: JSON, Parquet, CSV, Avro, ORC, Hive, S3 sau Kafka.
⬤ Efectuați analize pe loturi și fluxuri de date utilizând Structured Streaming.
⬤ Construirea de conducte de date fiabile cu Delta Lake și Spark din surse deschise.
⬤ dezvoltați conducte de învățare automată cu MLlib și produceți modele folosind MLflow.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)