Evaluare:
Cartea servește drept introducere la Dask și la capacitățile sale, dar are recenzii mixte în ceea ce privește publicul țintă și profunzimea informațiilor. Deși oferă o imagine de ansamblu bună și comparații cu Pandas, de multe ori se adâncește în concepte elementare care ar putea să nu fie relevante pentru cititorii vizați.
Avantaje:⬤ Introducere bună pentru începători
⬤ explicații puternice ale structurilor de date ale Dask
⬤ comparație eficientă cu Pandas
⬤ resursă valoroasă pentru înțelegerea conceptelor de știința datelor
⬤ sintaxă clară și cazuri de utilizare.
⬤ Prea de bază pentru utilizatorii intermediari
⬤ include concepte elementare irelevante
⬤ aspectul și structura ar putea fi îmbunătățite
⬤ unele probleme tehnice constatate
⬤ conținutul poate fi prea detaliat pentru publicul vizat.
(pe baza a 6 recenzii ale cititorilor)
Data Science with Python and Dask
Rezumat
Dask este un instrument nativ de analiză paralelă conceput pentru a se integra perfect cu bibliotecile pe care le utilizați deja, inclusiv Pandas, NumPy și Scikit-Learn. Cu Dask puteți analiza și lucra cu seturi uriașe de date, folosind instrumentele pe care le aveți deja. Iar Data Science with Python and Dask este ghidul dvs. pentru a utiliza Dask pentru proiectele dvs. de date, fără a schimba modul în care lucrați.
Achiziționarea cărții tipărite include o carte electronică gratuită în format PDF, Kindle și ePub de la Manning Publications. Veți găsi instrucțiuni de înregistrare în interiorul cărții tipărite.
Despre tehnologie
O conductă de date eficientă înseamnă totul pentru succesul unui proiect de știința datelor. Dask este o bibliotecă flexibilă pentru calcul paralel în Python, care facilitează crearea de fluxuri de lucru intuitive pentru ingerarea și analizarea seturilor de date mari și distribuite. Dask oferă programarea dinamică a sarcinilor și colecții paralele care extind funcționalitatea NumPy, Pandas și Scikit-learn, permițând utilizatorilor să își scaleze cu ușurință codul de la un singur laptop la un cluster de sute de mașini.
Despre carte
Știința datelor cu Python și Dask vă învață să construiți proiecte scalabile care pot gestiona seturi masive de date. După ce veți cunoaște cadrul Dask, veți analiza datele din baza de date NYC Parking Ticket și veți utiliza DataFrames pentru a vă eficientiza procesul. Apoi, veți crea modele de învățare automată utilizând Dask-ML, veți construi vizualizări interactive și veți construi clustere utilizând AWS și Docker.
Ce este în interior
⬤ Lucrul cu seturi de date mari, structurate și nestructurate.
⬤ Vizualizare cu Seaborn și Datashader.
⬤ Implementarea propriilor algoritmi.
⬤ Construirea de aplicații distribuite cu Dask Distributed.
⬤ Pachetarea și implementarea aplicațiilor Dask.
Despre cititor
Pentru oamenii de știință și dezvoltatorii de date cu experiență în utilizarea Python și a stivei PyData.
Despre autor
Jesse Daniel este un dezvoltator Python cu experiență. A predat Python for Data Science la Universitatea din Denver și conduce o echipă de cercetători de date la o companie de tehnologie media din Denver.
Tabla de conținut
PARTEA 1 - Elementele de bază ale calculului scalabil.
⬤ De ce contează calculul scalabil.
⬤ Introducere în Dask.
PARTEA 2 - Lucrul cu date structurate utilizând Dask DataFrames.
⬤ Introducere în Dask DataFrames.
⬤ Încărcarea datelor în DataFrames.
⬤ Curățarea și transformarea DataFrames.
⬤ Sumarizarea și analizarea cadrelor DataFrame.
⬤ Vizualizarea cadrelor de date cu Seaborn.
⬤ Vizualizarea datelor de localizare cu Datashader.
PARTEA 3 - Extinderea și implementarea Dask.
⬤ Lucrul cu Bags și Arrays.
⬤ Învățarea mecanică cu Dask-ML.
⬤ Extinderea și implementarea Dask.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)