Evaluare:
Cartea „Querying Databricks with Spark SQL” oferă o acoperire completă a conceptelor de bază și avansate în Spark SQL. Este bine structurată cu scenarii de afaceri pentru a introduce interogările SQL și oferă explicații clare. Cu toate acestea, unii cititori au găsit probleme cu instrucțiunile și organizarea.
Avantaje:⬤ Acoperire cuprinzătoare a Spark SQL, potrivită atât pentru începători, cât și pentru utilizatorii avansați
⬤ structură și explicații clare
⬤ bază de date eșantion bine concepută
⬤ secțiune valoroasă „Trucuri și capcane”
⬤ lectură satisfăcătoare pentru profesioniștii SQL care caută subiecte avansate.
⬤ Instrucțiunile pentru configurarea setului de date au fost neclare
⬤ resursele GitHub au fost prost organizate
⬤ calitatea legării cărții ar putea fi îmbunătățită
⬤ subiecte ratate, cum ar fi instrucțiunile SQL MERGE, UPDATE, DELETE
⬤ sughiț inițial cu instrucțiunile de import a fișierelor de date.
(pe baza a 2 recenzii ale cititorilor)
Querying Databricks with Spark SQL
Un ghid practic pentru utilizarea Spark SQL pentru a efectua interogări complexe pe datele Databricks
Caracteristici cheie
● Învățați SQL de la zero, fără a fi necesare cunoștințe anterioare de programare sau SQL.
● Vă dezvoltați progresiv cunoștințele și abilitățile, de la interogarea de bază a datelor la analize complexe.
● Obțineți experiență practică cu SQL, acoperind toate nivelurile de cunoștințe, de la novice la expert.
Descriere
Databricks se remarcă ca o platformă larg îmbrățișată, dedicată creării de lacuri de date. În cadrul său, acesta extinde suportul pentru o versiune specializată a limbajului de interogare structurat (SQL) cunoscut sub numele de Spark SQL. Dacă sunteți interesat să aflați mai multe despre cum să utilizați Spark SQL pentru a analiza date într-un lac de date, atunci această carte este pentru dumneavoastră.
Cartea acoperă totul, de la interogări de bază la sarcini complexe de procesare a datelor. Ea începe cu o introducere în SQL și Spark. Se acoperă apoi elementele de bază ale SQL, inclusiv tipurile de date, operatorii și clauzele. Următoarele câteva capitole se concentrează pe filtrare, agregare și calcul. În plus, acesta acoperă datele și orele, formatarea rezultatelor și utilizarea logicii în interogări. Se abordează, de asemenea, unirea tabelelor, subinterogările, tabelele derivate și expresiile comune ale tabelelor. În plus, se discută despre subinterogări corelate, unirea și filtrarea seturilor de date, utilizarea SQL în calcule, segmentarea și clasificarea datelor, analiza rulării și analiza datelor în timp. Cartea se încheie cu un capitol privind prezentarea avansată a datelor.
Până la sfârșitul cărții, veți putea utiliza Spark SQL pentru a efectua sarcini complexe de analiză a datelor pe lacuri de date.
Ce veți învăța
● Utilizați Spark SQL pentru a citi date dintr-un lac de date.
● Aflați cum să filtrați, să agregați și să calculați date utilizând Spark SQL.
● Învățați cum să uniți tabele, să utilizați subcercetări și să creați tabele derivate în Spark SQL.
● Analizați datele în timp utilizând Spark SQL pentru a urmări tendințele și a identifica modele în date.
● Prezentați datele într-un mod vizual atrăgător utilizând Spark SQL.
Pentru cine este această carte
Această carte este pentru oricine dorește să învețe cum să utilizeze SQL pentru a analiza date mari. Fie că sunteți analist de date, student, dezvoltator de baze de date, contabil, analist de afaceri, cercetător de date sau oricine altcineva care trebuie să extragă informații din seturi mari de date, această carte vă va învăța abilitățile de care aveți nevoie pentru a vă face treaba.
Tabla de conținut
1. Scrierea interogărilor SQL de bază
2. Filtrarea datelor
3. Aplicarea de filtre complexe la interogări
4. Calcule simple
5. Agregarea rezultatelor
6. Lucrul cu datele în Databricks
7. Formatarea textului în rezultatul interogării
8. Formatarea numerelor și a datelor
9. Utilizarea logicii de bază pentru îmbunătățirea analizei
10. Utilizarea tabelelor multiple la interogarea datelor
11. Utilizarea îmbinărilor avansate de tabele
12. Subinterogări
13. Tabele derivate
14. Expresii comune de tabel
15. Subinterogări corelate
16. Manipularea seturilor de date
17. Utilizarea SQL pentru calcule mai avansate
18. Segmentarea și clasificarea datelor
19. Rularea analizei
20. Analiza datelor în timp
21. Ieșirea datelor complexe
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)