Evaluare:
În prezent, nu există recenzii ale cititorilor. Evaluarea se bazează pe 9 voturi.
Pandas for Everyone: Python Data Analysis
Introducere practică, bogată în exemple, la analiza datelor Pandas în Python
Astăzi, analiștii trebuie să gestioneze date caracterizate printr-o varietate, viteză și volum extraordinare. Folosind biblioteca open source Pandas, puteți utiliza Python pentru a automatiza și a efectua rapid aproape orice sarcină de analiză a datelor, indiferent cât de mare sau complexă este. Pandas vă poate ajuta să vă asigurați veridicitatea datelor, să le vizualizați pentru a lua decizii eficiente și să reproduceți în mod fiabil analize pe mai multe seturi de date.
Pandas pentru toată lumea reunește cunoștințe practice și perspective pentru rezolvarea problemelor reale cu Pandas, chiar dacă sunteți nou în domeniul analizei datelor cu Python. Daniel Y. Chen introduce conceptele cheie prin exemple simple, dar practice, bazându-se treptat pe acestea pentru a rezolva probleme mai dificile, din lumea reală.
Chen vă oferă un start rapid în utilizarea Pandas cu un set de date realist și acoperă combinarea seturilor de date, gestionarea datelor lipsă și structurarea seturilor de date pentru o analiză și vizualizare mai ușoară. El demonstrează tehnici puternice de curățare a datelor, de la manipularea de bază a șirurilor de caractere la aplicarea simultană a funcțiilor în cadrele de date.
Odată ce datele dvs. sunt gata, Chen vă ghidează prin ajustarea modelelor pentru predicție, grupare, inferență și explorare. El oferă sfaturi privind performanța și scalabilitatea și vă introduce în ecosistemul mai larg de analiză a datelor Python.
⬤ Lucrați cu DataFrames și Series, și importați sau exportați dateCreați diagrame cu matplotlib, seaborn și pandas.
⬤ Combinați seturi de date și gestionați datele lipsă.
⬤ Reformați, ordonați și curățați seturile de date astfel încât să fie mai ușor de utilizat.
⬤ Conversia tipurilor de date și manipularea șirurilor de text.
⬤ Aplicați funcții pentru manipularea datelor la scară largă.
⬤ Agregarea, transformarea și filtrarea seturilor mari de date cu groupby.
⬤ Utilizați capacitățile avansate de dată și oră ale Pandas.
⬤ Amplasarea modelelor liniare utilizând statsmodels și bibliotecile scikit-learn.
⬤ Utilizați modelarea liniară generalizată pentru a ajusta modele cu diferite variabile de răspuns.
⬤ Compararea mai multor modele pentru a selecta cel mai bun.
⬤ Regularizarea pentru a depăși supraajustarea și a îmbunătăți performanța.
⬤ Utilizați gruparea în învățarea automată nesupravegheată.
⬤ .
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)