Evaluare:
Cartea este privită pozitiv de unii ca o introducere plăcută și practică în Hadoop și Spark, în timp ce alții o critică pentru că este superficială și nu oferă cunoștințe aprofundate despre aceste subiecte.
Avantaje:⬤ Bine scrisă
⬤ lectură plăcută
⬤ oferă o bună introducere în Hadoop/Spark
⬤ acoperă cazuri practice de utilizare în știința datelor
⬤ potrivită pentru cei cu ceva experiență anterioară.
⬤ Lipsă de profunzime și acoperire semnificativă a Hadoop/Spark
⬤ considerată prea superficială și generică
⬤ titlu înșelător
⬤ scumpă pentru conținutul oferit
⬤ nu este potrivită pentru începători care caută cunoștințe complete.
(pe baza a 8 recenzii ale cititorilor)
Practical Data Science with Hadoop and Spark: Designing and Building Effective Analytics at Scale
Ghidul complet pentru știința datelor cu Hadoop - pentru profesioniști tehnici, oameni de afaceri și studenți
Cererea crește vertiginos pentru profesioniștii care pot rezolva probleme reale de știința datelor cu Hadoop și Spark. Știința practică a datelor cu Hadoop(R) și Spark este ghidul dumneavoastră complet pentru a face exact acest lucru. Bazându-se pe o experiență imensă cu Hadoop și big data, trei experți de top reunesc tot ceea ce aveți nevoie: concepte la nivel înalt, tehnici aprofundate, cazuri reale de utilizare, aplicații practice și tutoriale practice.
Autorii prezintă elementele esențiale ale științei datelor și ecosistemul Hadoop modern, explicând modul în care Hadoop și Spark au evoluat într-o platformă eficientă pentru rezolvarea problemelor de știința datelor la scară largă. În plus față de acoperirea cuprinzătoare a aplicațiilor, autorii oferă, de asemenea, îndrumări utile cu privire la pașii importanți ai ingestiei, mungerii și vizualizării datelor.
Odată puse bazele, autorii se concentrează pe aplicații specifice, inclusiv învățarea automată, modelarea predictivă pentru analiza sentimentelor, gruparea pentru analiza documentelor, detectarea anomaliilor și prelucrarea limbajului natural (NLP).
Acest ghid oferă o bază tehnică solidă pentru cei care doresc să practice știința datelor și prezintă, de asemenea, îndrumări orientate către afaceri cu privire la modul de aplicare a Hadoop și Spark pentru a optimiza rentabilitatea inițiativelor de știința datelor.
Aflați.
⬤ Ce este știința datelor, cum a evoluat și cum să planificați o carieră în știința datelor.
⬤ Cum volumul, varietatea și viteza datelor modelează cazurile de utilizare a științei datelor.
⬤ Hadoop și ecosistemul său, inclusiv HDFS, MapReduce, YARN și Spark.
⬤ Importul de date cu Hive și Spark.
⬤ Calitatea datelor, preprocesarea, pregătirea și modelarea.
⬤ Visualizare: scoaterea la suprafață a informațiilor din seturi uriașe de date.
⬤ Învățarea mecanică: clasificare, regresie, clustering și detectarea anomaliilor.
⬤ Algoritmi și instrumente Hadoop pentru modelarea predictivă.
⬤ Analiză de cluster și funcții de similaritate.
⬤ Detecția anomaliilor la scară largă.
⬤ NLP: aplicarea științei datelor la limbajul uman.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)