Evaluare:
Cartea despre Apache Spark (axată în principal pe PySpark) a primit un amestec de recenzii, subliniind abordarea sa practică, explicațiile detaliate și exemplele extinse atât în Scala, cât și în Python. Cu toate acestea, se confruntă, de asemenea, cu critici pentru organizarea, acuratețea codului și problemele de formatare atunci când este citită pe anumite dispozitive.
Avantaje:⬤ Abordare practică de învățare
⬤ acoperire cuprinzătoare a conceptelor Spark
⬤ exemple de cod detaliate în Scala și Python
⬤ include secțiuni ML
⬤ material organizat pentru înțelegerea arhitecturii Spark
⬤ bun pentru cursanții care fac tranziția de la alte limbaje de programare
⬤ util ca sursă unică pentru Spark în producție.
⬤ Unele exemple de cod sunt incorecte sau necesită modificări
⬤ organizarea poate fi întreruptă
⬤ probleme de formatare pe platformele digitale (de exemplu, Kindle)
⬤ paginile pot fi de calitate slabă la tipărire
⬤ unii îl consideră repetitiv
⬤ poate să nu ofere cunoștințe imediat utilizabile pentru toți cititorii.
(pe baza a 71 recenzii ale cititorilor)
Spark: The Definitive Guide: Big Data Processing Made Simple
Învățați cum să utilizați, să implementați și să mențineți Apache Spark cu acest ghid cuprinzător, scris de creatorii acestui cadru open-source de cluster-computing. Cu accent pe îmbunătățirile și noile caracteristici din Spark 2. 0, autorii Bill Chambers și Matei Zaharia împart subiectele Spark în secțiuni distincte, fiecare cu obiective unice.
Veți explora operațiunile de bază și funcțiile comune ale API-urilor structurate ale Spark, precum și Structured Streaming, un nou API de nivel înalt pentru crearea de aplicații de streaming end-to-end. Dezvoltatorii și administratorii de sistem vor învăța elementele de bază ale monitorizării, reglării și depanării Spark și vor explora tehnici și scenarii de învățare automată pentru utilizarea MLlib, biblioteca scalabilă de învățare automată Spark.
⬤ Obțineți o prezentare generală ușoară a big data și Spark.
⬤ Învățați despre DataFrames, SQL și Datasets - API-urile de bază ale Spark - prin exemple de lucru.
⬤ Divideți API-urile Spark de nivel scăzut, RDD-urile și execuția SQL și DataFrames.
⬤ Înțelegeți cum rulează Spark pe un cluster.
⬤ Depanarea, monitorizarea și reglarea clusterelor și aplicațiilor Spark.
⬤ Învățați puterea Structured Streaming și MLlib ale Spark pentru sarcinile de învățare automată.
⬤ Explorați ecosistemul Spark mai larg, inclusiv SparkR și Graph Analysis.
⬤ Examinați implementarea Spark, inclusiv acoperirea Spark in the Cloud.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)