Evaluare:
În prezent, nu există recenzii ale cititorilor. Evaluarea se bazează pe 8 voturi.
Learning Apache Drill: Query and Analyze Distributed Data Sources with SQL
Fiți la curent cu Apache Drill, un motor de interogare SQL distribuit extensibil care citește seturi masive de date în multe formate de fișiere populare, precum Parquet, JSON și CSV. Drill citește date în HDFS sau în medii de stocare cloud-native precum S3 și funcționează cu metastore-uri Hive împreună cu baze de date distribuite precum HBase, MongoDB și baze de date relaționale. Drill funcționează oriunde: pe laptopul dvs. sau în cel mai mare cluster.
În această carte practică, Charles Givre și Paul Rogers, committeri ai Drill, arată analiștilor și cercetătorilor de date cum să interogheze și să analizeze date brute utilizând acest instrument puternic. În prezent, cercetătorii de date își petrec aproximativ 80% din timp doar culegând și curățând date. Cu ajutorul acestei cărți, veți afla cum Drill vă ajută să analizați datele mai eficient pentru a reduce timpul necesar pentru a obține informații.
⬤ Utilizați Drill pentru a curăța, pregăti și rezuma date delimitate pentru o analiză ulterioară.
⬤ Cercetați tipuri de fișiere, inclusiv logfiles, Parquet, JSON și alte formate complexe.
⬤ Cercetați Hadoop, baze de date relaționale, MongoDB și Kafka cu SQL standard.
⬤ Conectați-vă programatic la Drill utilizând o varietate de limbaje.
⬤ Utilizați Drill chiar și cu formate de fișiere dificile sau ambigue.
⬤ Efectuați analize sofisticate prin extinderea funcționalității Drill cu funcții definite de utilizator.
⬤ Facilitați analiza datelor pentru securitatea rețelelor, metadatele imaginilor și învățarea automată.
© Book1 Group - toate drepturile rezervate.
Conținutul acestui site nu poate fi copiat sau utilizat, nici parțial, nici integral, fără permisiunea scrisă a proprietarului.
Ultima modificare: 2024.11.08 07:02 (GMT)