Cartea de bucate Python Web Scraping - stăpânește extragerea datelor web cu 90+ rețete

Cartea de bucate Python Web Scraping: Peste 90 de rețete dovedite pentru a face scraping cu Python, microservicii, Docker și AWS (Michael Heydt)

Recenzii ale cititorilor

Rezumat:

Cartea despre web scraping a primit în mare parte recenzii negative, utilizatorii exprimându-și frustrarea cu privire la lipsa sa de profunzime și de îndrumare practică. Unii au considerat că este mai benefic să caute în schimb ajutor din resurse online precum YouTube și Stack Overflow.

Avantaje:

Unii utilizatori au considerat că această carte poate oferi cunoștințe de bază despre diverse biblioteci de scraping și ar putea fi utilă pentru utilizatorii interesați mai degrabă de crawling decât de scraping de site-uri cunoscute.

Dezavantaje:

Cartea nu oferă suficiente detalii pentru aplicarea practică, în special pentru începători/intermediari. Îi lipsesc subiecte esențiale precum gestionarea parolelor și JavaScript. Mulți au considerat-o inadecvată și au sugerat că resursele online sunt mult mai eficiente.

(pe baza a 3 recenzii ale cititorilor)

Titlul original:

Python Web Scraping Cookbook: Over 90 proven recipes to get you scraping with Python, microservices, Docker, and AWS

Conținutul cărții:

Dezlegați-vă complexitățile web scraping și accesați datele web cu ușurință utilizând scripturi Python

Caracteristici principale

⬤ Rețete practice pentru avansarea abilităților dvs. de web scraping la nivel de expert.

⬤ Ghid unic de soluții pentru a aborda sarcini complexe și dificile de web scraping folosind Python.

⬤ Înțelegeți structurile paginilor web și colectați date de pe un site web cu ușurință.

Descrierea cărții

Python Web Scraping Cookbook este o carte axată pe soluții care vă va învăța tehnici pentru a dezvolta scrapere de înaltă performanță și pentru a vă ocupa de crawlere, sitemaps, automatizarea formularelor, site-uri bazate pe Ajax, cache-uri și multe altele.

Veți explora o serie de scenarii din lumea reală în care fiecare parte a ciclului de viață al dezvoltării/produsului va fi complet acoperită. Nu numai că vă veți dezvolta abilitățile necesare pentru a proiecta și dezvolta fluxuri de date de performanță fiabile, dar și pentru a vă desfășura baza de cod pe AWS. Dacă sunteți implicat în ingineria software, dezvoltarea de produse sau extragerea datelor (sau sunteți interesat de construirea de produse bazate pe date), veți găsi această carte utilă, deoarece fiecare rețetă are un scop și un obiectiv clar. Chiar de la extragerea datelor din site-uri web la scrierea unui crawler web sofisticat, rețetele independente ale cărții vor fi o mană cerească. Această carte acoperă bibliotecile Python, cererile și BeautifulSoup. Veți învăța despre crawling, web spidering, lucrul cu site-uri web Ajax, elemente paginate și multe altele. Veți învăța, de asemenea, să abordați probleme precum erorile 403, lucrul cu proxy, scrapingul imaginilor și LXML.

Până la sfârșitul acestei cărți, veți putea să scrapați site-uri web mai eficient și veți fi capabil să.

Deplasați și operați scraperul în cloud.

Ce veți învăța

⬤ Utilizați o varietate de instrumente pentru a scrapa orice site web și date, inclusiv BeautifulSoup, Scrapy, Selenium și multe altele.

⬤ Master limbaje de expresie, cum ar fi XPath și CSS, și expresii regulate pentru a extrage date web.

⬤ Luați în considerare capcane de scraping, cum ar fi câmpurile de formular ascunse, accelerarea, paginarea și codurile de stare diferite.

⬤ Construiți conducte robuste de scraping cu SQS și RabbitMQ.

⬤ Scraparea activelor precum imaginile media și învățarea a ceea ce trebuie să faceți atunci când Scraper nu reușește să ruleze.

⬤ Explorați tehnicile ETL de construire a unui crawler personalizat, parser și convertiți datele structurate și nestructurate din site-uri web.

⬤ Deplasați și rulați scraperul dvs. ca serviciu în AWS Elastic Container Service.

Pentru cine este această carte

Această carte este ideală pentru programatorii Python, administratorii web, profesioniștii din domeniul securității și oricine dorește să efectueze analize web. Familiarizarea cu Python și înțelegerea de bază a web scraping-ului vor fi utile pentru a profita la maximum de această carte.

Alte date despre carte:

ISBN:	9781787285217
Autor:	Michael Heydt
Editura:	Packt Pub
Limbă:	engleză
Legare:	Copertă moale

Cumpărare:

Disponibil în prezent, pe stoc.

Cartea de bucate Python Web Scraping: Peste 90 de rețete dovedite pentru a face scraping cu Python, microservicii, Docker și AWS

Recenzii ale cititorilor

Titlul original:

Conținutul cărții:

Alte date despre carte:

Cumpărare:

Alte cărți ale autorului:

Lucrările autorului au fost publicate de următorii editori: