Evaluare:
Cartea oferă o introducere solidă în Apache Spark, în special pentru cei deja familiarizați cu dezvoltarea de software. Este bine structurată, acoperind subiecte de la bază la avansate, în principal în Python și abordând caracteristici Spark relevante. Cu toate acestea, unii utilizatori au remarcat informații învechite, în special legate de instalații, și o lipsă de cazuri de utilizare avansate sau acoperire aprofundată în anumite domenii.
Avantaje:⬤ Oferă o abordare bine structurată și metodică pentru o învățare rapidă.
⬤ Bună pentru începători și entuziaști Python.
⬤ Acoperă o mare varietate de caracteristici Spark, inclusiv Spark-SQL și MLlib.
⬤ Accesibilă și ușor de asimilat, ceea ce o face potrivită pentru o inițiere rapidă în Spark.
⬤ Include referințe la lucrări de cercetare pentru o înțelegere mai profundă.
⬤ Unele informații sunt învechite, în special în ceea ce privește instalațiile și binarele Hadoop.
⬤ Lipsesc cazurile avansate de utilizare și sfaturile de reglare a performanței.
⬤ Se concentrează în principal pe Python, cu mai puțin accent pe Scala sau pe subiecte avansate.
⬤ Au fost observate mai multe greșeli de ortografie, indicând necesitatea unei mai bune corecturi.
⬤ Unele capitole, cum ar fi Spark Streaming, nu sunt detaliate.
(pe baza a 23 recenzii ale cititorilor)
Apache Spark in 24 Hours, Sams Teach Yourself
Apache Spark este un motor de procesare distribuită open source rapid, scalabil și flexibil pentru sistemele big data și este unul dintre cele mai active proiecte open source big data de până acum. În doar 24 de lecții de o oră sau mai puțin, Sams Teach Yourself Apache Spark in 24 Hours vă ajută să construiți soluții practice Big Data care valorifică viteza, scalabilitatea, simplitatea și versatilitatea uimitoare ale Spark.
Abordarea directă, pas cu pas, a acestei cărți vă arată cum să implementați, să programați, să optimizați, să gestionați, să integrați și să extindeți Spark - acum și pentru anii următori. Veți descoperi cum să creați soluții puternice care cuprind cloud computing, procesarea fluxurilor în timp real, machine learning și multe altele. Fiecare lecție se bazează pe ceea ce ați învățat deja, oferindu-vă o bază solidă pentru succesul în lumea reală.
Fie că sunteți analist de date, inginer de date, om de știință de date sau administrator de date, învățarea Spark vă va ajuta să avansați în carieră sau să vă angajați într-o nouă carieră în domeniul în plină expansiune al Big Data.
Aflați cum să.
- Descoperiți ce face Apache Spark și cum se încadrează în peisajul Big Data.
- Deplasați și rulați Spark local sau în cloud.
- Interacționați cu Spark din shell.
- Să profitați la maximum de arhitectura Spark Cluster.
- Dezvoltați aplicații Spark cu Scala și Python funcțional.
- Programarea cu Spark API, inclusiv transformări și acțiuni.
- Aplicați abordări practice de inginerie/analiză a datelor concepute pentru Spark.
- Utilizați seturi de date distribuite rezistente (RDD) pentru caching, persistență și ieșire.
- Optimizarea performanței soluțiilor Spark.
- Utilizarea Spark cu SQL (prin Spark SQL) și cu NoSQL (prin Cassandra)
- Utilizați tehnici de programare funcțională de ultimă oră.
- Extindeți Spark cu streaming, R și Sparkling Water.
- Începeți să construiți aplicații de învățare automată și procesare grafică bazate pe Spark.
- Explorați tehnologii avansate de mesagerie, inclusiv Kafka.
- Previzualizați și pregătiți-vă pentru următoarea generație de inovații Spark.
Instrucțiunile vă ghidează prin întrebări, probleme și sarcini comune.
Întrebările și răspunsurile, testele și exercițiile vă dezvoltă și vă testează cunoștințele.
Sfaturile Did You Know? oferă sfaturi din interior și scurtături.
Iar alertele Watch Out vă ajută să evitați capcanele. În momentul în care veți termina, vă veți simți confortabil folosind Apache Spark pentru a rezolva un spectru larg de probleme Big Data.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)